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(57) Zusammenfassung: Verfahren zur gentechnischen Veranderang von Organismen der Gattung Blakeslea, entsprechende Or- 
ganismen und deren Verwendung Zusammenfassung Verfahren zur Herstellung eines gentechnisch veranderten Organismus der 
Gattung Blakeslea umfassend (i) Transformation mindestens einer der Zellen, (ii) ggf. Homokaryotisierung der aus (i) erhaltenen 
ZeUen, so dass Zellen entstehen, in denen die Kerne in einem oder mehreren genetischen Merkmalen alle gleichartig verandert sind 
und diese gentechnische Veranderung zur Auspragung bringen, und (iii) Selektion und Anzucht der gentechnisch veranderten Zelle 
oder Zellen. 
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Verfahren zur qentechnischen Veranderunq von Oraanismen der 
Gattuna Blakeslea. entsprechende Orqanismen und deren 

Verwendunq 

Die Erfindung betrifft ein Verfahren zur gentechnischen Veranderung von 
Organismen der Gattung Blakeslea, entsprechende Organismen und 
deren Verwendung. 

Pilze der Gattung Blakeslea sind als Produktionsorganismen bekannt. So 
wird z. B. Blakeslea trispora als Produktionsorganismus fQr p-Carotin 
(Ciegler, 1965, Adv Appl Microbiol. 7:1) und Lycopin verwendet (EP 
1201762, EP 1184464, WO 03/038064). Daneben kommt Blakeslea zur 
Produktion anderer lipophiler Substanzen in Frage wie z.B. andere 
Carotinoide und deren Vorstufen, Phospholipide, Triacylglyceride, 
Steroide, Wachse, fettlosliche Vitamine, Provitamine und Cofaktoren oder 
zur Produktion hydrophiler Substanzen wie z.B. Eiweide, Aminosauren, 
Nukleotide und wasserlosliche Vitamine, Provitamine und Cofaktoren. 

Die hohen Produktivitaten fur p-Carotin und Lycopin machen Blakeslea, 
insbesondere Blakeslea trispora attraktiv fur die wirtschaftliche 
fermentative Herstellung von Carotinoiden und deren Vorstufen. 

Allerdings ist es auch von Interesse, die Produktivitaten der bisher 
nattirlicherweise produzierten Carotine und deren Vorstufen weiter zu 
steigem und die Herstellung weiterer Carotinoide, wie z. B. Xanthophylle 
zu ermoglichen, die von Blakeslea bisher nicht oder nur in sehr geringem 
Malie gebildet und isoliert werden konnen. 

Carotinoide werden Futtermitteln, Nahrungsmitteln, 

Nahrungserganzungsmitteln, Kosmetika und Arzneimitteln zugesetzt. Die 
Carotinoide dienen vor allem als Pigmente zur Farbung. Daneben werden 
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die antioxidative Wirkung der Carotinoide und andere Eigenschaften 
dieser Substanzen genutzt. Man unterteilt die Carotinoide in die reinen 
Kohlenwasserstoffe, die Carotine und die sauerstoffhaltigen 
Kohlenwasserstoffe, die Xanthophylle. Xanthophylle wie Canthaxanthin 

5 und Astaxanthin werden beispielsweise zur Pigmentierung von 
Huhnereiern und Fischen eingesetzt (Britton et al. 1998, Carotinoids, Vol 
3, Biosynthesis and Metabolism). Die Carotine P-Carotin und Lycopin 
werden vor allem in der Humanernahrung eingesetzt. p-Carotin wird 
beispielsweise als Getrankefarbstoff verwendet. Lycopin hat eine 

10 krankheitsvorbeugende Wirkung (Argwal und Rao, 2000, CMAJ 163:739- 
744; Rao und Argwal 1999, Nutrition Research 19:305-323). Die farblose 
Carotinoidvorstufe Phytoen kommt vor allem fur Anwendungen als 
Antioxidans in Frage. 

15 Der uberwiegende Teil der Carotinoide und deren Vorstufen, die als 
Zusatzstoffe fur die oben genannten Anwendungen eingesetzt werden, 
wird durch chemische Synthese hergestellt. Die chemische Synthese ist 
mehrstufig, technisch sehr aufwendig und verursacht hohe Herstellkosten. 
Fermentative Verfahren sind demgegenQber technisch verhaltnismafiig 

20 einfach und basieren auf kostengunstigen Einsatzstoffen. Fermentative 
Verfahren zur Herstellung von Carotinoiden konnen dann wirtschaftlich 
attraktiv und wettbewerbsfahig zur chemischen Synthese sein, wenn die 
Produktivitat der bisherigen fermentativen Verfahren gesteigert wurde Oder 
neue Carotinoide auf Basis der bekannten Produktionsorganismen 

25 hergestellt werden konnten. 

Ein Verfahren zur gentechnischen Veranderung von Blakeslea trispora ist 
erforderlich insbesondere, wenn Blakeslea zur Herstellung von 
Xanthophyllen genutzt werden soil, weil diese Verbindungen 
30 natOrlicherweise von Blakeslea nicht synthetisiert werden. 



WO 2004/063358 



PCT/EP2004/000100 



3 

Von Blakeslea trispora sind bisher verschiedene DNA-Sequenzen bekannt 
insbesondere die DNA-Sequenz, die fur die Gene der 
Carotinoidbiosynthese von Geranylgeranylpyrophosphat bis p-Carotin 
codiert (WO 03/027293). 

5 

Allerdings sind bisher keine Methoden zur gentechnischen Veranderung 
von Blakeslea, insbesondere Blakeslea trispora bekannt. 

Als Methode zur Herstellung von gentechnischen veranderten Pilzen 
10 wurde in einigen Fallen die Agrobacterium-vermittelte Transformation 
erfolgreich elngesetzt. So sind z. B. folgende Organismen durch 
Agrobakterien transformiert worden: Saccharomyces cerevisiae (Bundock 
et al., 1995, EMBO Journal, 14:3206-3214), Aspergillus awamori, 
Aspergillus nidulans, Aspergillus niger, Colletotrichum gloeosporioides, 
15 Fusarium solani pisi, Neurospora crassa, Trichoderma reesei, Pleurotus 
ostreatus, Fusarium graminearum (van der Toorren et al., 1997, EP 
870835), Agraricus bisporus, Fusarium venenatum (de Groot et al., 1998, 
Nature Biotechnol. 16:839-842), Mycosphaerella graminicola (Zwiers etal. 
2001, Cunr. Genet. 39:388-393), Glarea lozoyensis (Zhang et al., 2003, 
20 Mol. Gen. Genomics 268:645-655), Mucor miehei (Monfort et al. 2003, 
FEMS Microbiology Lett. 244:101 - 106). 

Von Interesse ist besonders eine homologe Rekomblnation, bei der 
zwischen der einzufuhrenden DNA und der Zell-DNA moglichst viele 
25 Sequenzhomologien bestehen, so dass eine ortsspezifische Einfuhrung 
bzw. Ausschaltung von genetischer Information im Genom des 
Empfangerorganismus moglich ist. Andemfalls wird die Spender-DNA 
durch illegitime bzw. nicht-homologe Rekombination ins Genom des 
Empfangerorganismus integriert, was nicht ortsspezifisch erfolgt. 

30 
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Eine durch Agrobacterium vermittelte Transformation und anschlieftende 
homologe Rekombination der transferierten DNA wurde bisher bei 
folgenden Organismen nachgewiesen: Aspergillus awamori (Gouka et al. 
1999, Nature Biotech 17:598-601), Glarea lozoyensis (Zhang et al., 2003, 
5 Mol. Gen. Genomics 268:645-655), Mycosphaerella graminicola (Zwiers et 
al. 2001, Curr. Genet. 39:388-393). 

Als weitere Methode zur Transformation von Pilzen ist die Elektroporation 
bekannt. Die integrative Transformation von Hefe durch Elektroporation 
10 wurde von Hill, Nucl. Acids. Res. 17:8011 gezeigt. Fur filamentose Pilze 
wurde die Transformation durch Chakaborty und Kapoor beschrieben 
(1990, Nucl. Acids. Res. 18:6737). 

Eine „biolistische" Methode, d.h. die Obertragung von DNA durch 
15 Beschuss von Zellen mit DNA-beladenen Partikeln wurde beispielsweise 
fur Trichoderma harzianum und Gliocladium virens beschrieben (Lorito et 
al. 1993, Curr. Genet. 24:349-356). 

Diese Methoden konnten bisher jedoch nicht erfolgreich zur gezielten 
20 genetischen Veranderung von Blakeslea und insbesondere Blakeslea 
trispora eingesetzt werden. 

Eine besondere Schwierigkeit bei der Herstellung von gezielt genetisch 
veranderten Blakeslea und Blakeslea trispora ist die Tatsache, dass deren 

25 Zellen in alien Stadien des sexuelien und des vegetativen Zellzyklus 
mehrkernig sind. In Sporen von Blakeslea trispora Stamm NRRL2456 und 
NRRL2457 wurden z. B. im Durchschnitt 4,5 Kerne pro Spore 
nachgewiesen (Metha und Cerda-Olmedo, 1995, Appl. . Microbiol. 
Biotechnol. 42:836-838). Dies hat zur Folge, dass die gentechnische 

30 Veranderung in aller Regel nur in einem oder wenigen Kernen voriiegt, die 
Zellen also heterokaryotisch sind. 
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Sollen die genetisch veranderten Blakeslea-Arten, insbesondere 
Blakeslea trispora zur Produktion eingesetzt werden, so ist es 
insbesondere bei einer Gendeletion wichtig, dass in den 
5 Produktionsstammen die gentechnische Veranderung in alien Kernen 
voriiegt, so dass eine stabile und hohe Syntheseleistung ohne 
Nebenprodukte moglich wird. Die Stamme mussen folglich in Bezug auf 
die gentechnische Veranderung homokaryotisch sein. 

10 Lediglich fur Phycomyces blakesleeanus ist ein Verfahren beschrieben 
worden, um homokaryotische Zellen zu erzeugen (Roncero et al., 1984, 
Mutat Res. 125:195). Durch Zugabe des mutagenen Agens MNNG (N- 
Methyl-N'-nitro-N-nitrosoguanidin) werden nach dem dort beschriebenen 
Verfahren Kerne in den Zellen eliminiert, so dass statistisch eine gewisse 

15 Anzahl von Zellen mit nur noch einem funktionellem Kern voriiegt. Die 
Zellen werden dann einer Selektion unterzogen, in der nur einkernige 
Zellen mit einem rezessiven Selektionsmarker zu einem Mycel 
auswachsen konnen. Die Nachkommen dieser selektierten Zellen sind 
mehrkernig und homokaryotisch. Ein rezessiver Selektionsmarker fQr 

20 Phycomyces blakesleanus ist z. B. dar. Dar + -Stamme nehmen das 
toxische Riboflavin-Analog 5-Carbon-5-deazariboflavin auf; Dar~-Stamme 
dagegen nicht (Delbriick et al. 1979, Genetics 92:27). Die Selektion von 
rezessiven Mutanten erfolgt durch Zugabe von 5-Carbon-5-deazariboflavin 
(DARF). 

25 

Allerdings ist dieses Verfahren nicht fur Blakeslea, insbesondere 
Blakeslea trispora bekannt und insbesondere nicht mit im Zusammenhang 
mit einer Transformation beschrieben worden. 

30 Aufgabe der vorliegenden Erfindung ist es, ein Verfahren bereitzustellen, 
mit dem eine gentechnische Veranderung von Blakeslea-Stammen, 
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insbesondere Blakeslea trispora moglich 1st. Dartiber hinaus ist es 
Aufgabe der Erfindung ein Verfahren bereitzustellen, das die Herstellung 
homokaryotischer genetisch veranderter Stamme eriaubt. Ferner ist es 
eine Aufgabe der Erfindung entsprechend gentechnisch veranderte Zellen 
5 bereitzustellen. 

Diese Aufgabe wird durch ein Verfahren zur Herstellung eines 
gentechnisch veranderten Organismus der Gattung Blakeslea gelost, 
umfassend 

10 (i) Transformation mindestens einer der Zellen, 

(ii) ggf. Homokaryotisierung der aus (i) erhaltenen Zellen, so dass 
Zellen entstehen, in denen die Kerne in einem oder in mehreren 
genetischen Merkmalen alle gleichartig verandert sind und diese 
genetische Veranderung zur Auspragung bringen, und 

15 (iii) Selektion der gentechnisch veranderten Zelle oder Zellen. 

Mit der erfindungsgema&en Methode ist es moglich, mehrkemige Zellen 
der Pilze Blakeslea gezielt und stabil genetisch zu verandern, um so Mycel 
aus Zellen mit einheitlichen Kemen zu gewinnen. Vorzugsweise handelt 
20 es sich Zellen von Pilzen der Art Blakeslea trispora. 

Unter Transformation wird die Clbertragung einer genetischen Information 
in den Organismus, insbesondere Pilz verstanden. Darunter sollen alle 
dem Fachmann bekannten Moglichkeiten zur Einschleusung der 
25 Information, insbesondere DNA fallen, z. B. Beschuss mit DNA-beladenen 
Partikeln, Transformation mittels Protoplasten, Mikroinjektion von DNA, 
Elektroporation, Konjugation oder Transformation kompetenter Zellen, 
Chemikalien oder Agrobakterien vermittelte Transformation. Als 
genetische Information werden ein Genabschnitt, ein Gen oder mehrere 
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Gene verstanden. Die genetische Information kann z. B. mit Hilfe eines 
Vectors Oder als freie NukleinsSure (z. B. DNA, RNA) und auf sonstige 
Weise in die Zellen eingebracht und entweder durch Rekombination ins 
Wirtsgenom eingebaut oder in freier Form in der Zelle voriiegen. 
5 Besonders bevorzugt ist hierbei die homologe Rekombination. 

Bevorzugte Transformationsmethode ist die Agrobacterium tumefaciens- 
vermittelte Transformation. Hierzu wird zunachst die zu transferierende 
Spender-DNA in einen Vektor eingefugt, der (i) flankierend zu der zu 

10 transferierenden DNA die T-DNA-Enden tragt, der (ii) einen 
Selektionsmarker enthalt und der (iii) ggf. Promotoren und Terminatoren 
fur die Genexpression der Spender-DNA aufweist. Dieser Vektor wird in 
einen Agrobacterium-tumefaciens-Stamm ubertragen, der ein Ti-Plasmid 
mit den vir-Genen enthalt. vir-Gene sind fur den DNA-Transfer in 

15 Blakeslea verantwortlich. Mit diesem Zwei-Vektor-Systern wird die DNA 
von Agrobacterium in Blakeslea flbertragen. Hierzu werden die 
Agrobakterien zunachst in Gegenwart von Acetosyringone inkubiert. 
Acetosyringone induziert die vir-Gene. AnschlieBend werden Sporen von 
Blakeslea trispora zusammen mit den induzierten Zellen von 

20 Agrobacterium tumefaciens auf Acetosyringone-haltigem Medium inkubiert 
und dann auf Medium ubertragen, das eine Selektion der Transformanten, 
d.h. der gentechnisch veranderten Stamme von Blakeslea ermoglicht. 

Der Begriff Vector wird in der vorliegenden Anmeldung als eine 
25 Bezeichnung fur ein DNA-MolekQI verwendet, das zum Einschleusen und 
ggf. zur Vermehrung von Fremd-DNA in eine Zelle dient (siehe auch 
"Vector" in Rompp Lexikon Chemie - CDROM Version 2.0, Stuttgart/New 
York: Georg Thieme Verlag 1999). In der vorliegenden Anmeldung sollen 
unter dem Begriff "Vector" Plasmide, Cosmide usw. verstanden werden, 
30 " die diesem Zweck dienen. 
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Unter Expression wird in der vorliegenden Anmeldung die Obertragung 
einer genetischen Information ausgehend von DNA oder RNA in ein Gen- 
Produkt (hier vorzugsweise Carotinoide) verstanden und soil auch den 
Begriff der Oberexpression beinhalten, womit eine verstarkte Expression 
5 gemeint ist, so dass ein bereits in der nicht transformierten Zelle (Wildtyp) 
hergestelltes Produkt verstarkt produziert wird oder einen groRen Teil des 
gesamten Gehaltes der Zelle ausmacht. 

Unter gentechnischer Veranderung soli die Einschleusung genetischer 
10 Information in einen Empfangerorganismus, so dass diese stabil exprimiert 
und bei der Zellteilung weitergegeben wird, verstanden werden. Danach 
wird gegebenenfalls die Homokaryontisierung durchgefQhrt, d.h. die 
Herstellung von Zellen, die nur einheitliche Kerne enthalten, d. h. Kerne 
mit gleichem genetischem Informationsgehalt. 

15 

Diese Homokaryotisierung ist insbesondere notwendig, wenn die durch 
Transformation eingefOhrte genetische Information rezessiv vorliegt, d. h. 
nicht zur Auspragung gelangt. Fuhrt die Transformation aber zu einem 
dominanten Vorliegen der genetischen Information, d. h. wird sie 
20 ausgepragt, so ist eine Homokaryotisierung nicht unbedingt notig. 

Vorzugsweise wird zur Homokaryotisierung eine Selektion der einkemigen 
Sporen durchgefQhrt. Von Natur aus ist ein geringer Anteil der Sporen von 
Blakeslea trispora einkemig, so dass sich diese ggf. nach speziftscher 
25 Markierung z. B. Farbung der Zellkerne aussortieren lassen. Dies wird 
bevorzugterweise mittels FACS (Fluorescence Activated Cell Sorting) 
anhand der geringeren Fluoreszenz der einkernigen Zellen durchgefUhrt. 

AlternatiV kann zur Homokaryotisierung zunachst eine Kernreduktion 
30 durchgefQhrt werden. Hierzu kann ein mutagenes Agens eingesetzt 
werden, wobei es sich insbesondere um N-Methyl-N-nitrornitrosoguanidin 
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(MNNG) handelt. Auch die Verwendung von energiereichen Strahlen, wie 
UV- oder Rontgen-Strahlen zur Kernreduktion ist moglich. Anschlieftend 
kann zur Selektion auf das FACS Verfahren oder rezessive 
Selektionsmarker zuruckgegriffen werden. 

5 

Unter Selektion wird die Auswahl von Zellen verstanden, deren Kerne 
dieselbe genetische Information beinhalten, d. h. Zellen die die gleichen 
Eigenschaften aufweisen, wie Resistenzen oder die Herstellung bzw. 
vermehrte Herstellung eines Produktes. In der Selektion werden neben 
10 der FACS Methode bevorzugt 5-Carbon-5-deazariboflavin (darf) und 
Hygromycin (hyg) oder 5'-Fluororotat (FOA) und Uracil eingesetzt. 

Der in der Transformation (i) eingesetzte Vector kann derart gestaltet sein, 
dass die im Vector enthaltene genetische Information in das Genom 
15 mindestens einer Zelle integriert wird. Dabei kann genetische Information 
in der Zelle ausgeschaltet werden. 

Der in der Transformation (i) eingesetzte Vector kann aber auch derart 
ausgestaltet sein, dass die im Vector enthaltene genetische Information in 
20 der Zelle exprimiert wird, d. h. genetische Information eingefugt wird, die 
im korrespondierenden Wildtyp nicht vorhanden ist oder die durch die 
Transformation verstarkt bzw. uberexprimiert wird. 

Der Vector kann beliebige genetische Informationen zur genetischen 
25 Veranderungen von Organismen der Gattung Blakeslea enthalten. 

Unter „genetischer Information" werden vorzugsweise Nukleinsauren 
verstanden, deren Einbringung in den Organismus der Gattung Blakeslea 
zu einer genetischen Veranderung in Organismen der Gattung Blakeslea, 
30 also beispielsweise zu einer Verursachung, Erhohung oder Reduzierung 
von Enzymaktivitaten im Vergleich zum Ausgangsorganismus fuhren. 
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Der Vector kann beispielsweise genetische Information zur Herstellung 
lipophiler Substanzen enthalten wie z.B. Carotinoide und deren Vorstufen, 
Phospholipide, Triacylglyceride, Steroide, Wachse, fettlSsliche Vitamine, 
5 Provitamine und Cofaktoren oder genetische Information zur Herstellung 
hydrophiler Substanzen wie z.B. EiweiBe, Aminosauren, Nukleotide und 
wasserlosliche Vitaminen, Provitamine und Cofaktoren. 

Bevorzugterweise enthalt der eingesetzte Vector genetische Informationen 
10 zur Herstellung von Carotinoiden oder Xanthophyllen oder deren 
Vorstufen. 

Bevorzugterweise enthSIt der Vektor genetische Information, die eine 
Lokalisierung der Carotinoidbiosynthese-Enzyme in dem Zellkompartiment 
15 bewirkt, in dem die Carotinoidbiosynthese stattfindet. 

Besonders bevorzugt sind genetische Informationen zur Herstellung von 
Astaxanthin, Zeaxanthin, Echinenon, p-Cryptoxanthin, Andonixanthin, 
Adonirubin, Canthaxanthin, 3- und 3-Hydroxyechinenon, Lycopin, Lutein, 
20 p-Carotin, Phytoen oder Phytofluen. Ganz besonders bevorzugt sind 
genetische Informationen zur Herstellung von Phytoen, Bixin, Lycopin, 
Zeaxanthin, Canthaxanthin und Astaxanthin. 

Entsprechend werden in einer bevorzugten Variante der Erfindung 
25 Organismen hergestellt und kultiviert, die uber eine erhohte Syntheserate 
filr Zwischenprodukte der Carotinoidbiosynthese verftlgen und folglich 
eine erhohte Produktivitat fur Endprodukte der Carotinoidbiosynthese 
aufweisen. Zur Erhohung der Syntheserate fQr Zwischenprodukte der 
Carotinoidbiosynthese werden insbesondere die Aktivitaten der Enzyme 3- 
30 Hydroxy-3-Methyl-Glutaryl-Coenzym-A-Reduktase, 
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Isopentenylpyrophosphat-lsomerase und Geranylpyrophosphatsynthase 
gesteigert. 

Entsprechend werden in einer besonders bevorzugten Variante der 
5 Erfindung Organismen hergestellt und kultiviert, die gegenuber dem 
Wildtyp eine erhohte HMG-CoA-Reduktase-Aktivitat aufweisen. 

Unter HMG-CoA-Reduktase-Aktivitat wird die Enzymaktivitat einer HMG- 
CoA-Reduktase (3-Hydroxy-3-Methyl-Glutaryl-Coenzym-A-Reduktase) 
10 verstanden. 

Unter einer HMG-CoA-Reduktase wird ein Protein verstanden, das 
die enzymatische Aktivitat aufweist, 3-Hydroxy-3-Methyl-Glutaryl- 
Coenzym-A in Mevalonat umzuwandeln. 

15 Dementsprechend wird unter HMG-CoA-Reduktase-Aktivitat die in einer 
bestimmten Zeit durch das Protein HMG-CoA-Reduktase umgesetzte 
Menge 3-Hydroxy-3-Methyl-Glutaryl-Coenzym-A bzw. gebildete Menge 
Mevalonat verstanden. 

20 Bei einer erhohten HMG-CoA-Reduktase-Aktivitat gegenuber dem Wildtyp 
wird somit im Vergleich zum Wildtyp in. einer bestimmten Zeit durch das 
Protein HMG-CoA-Reduktase die umgesetzte Menge 3-Hydroxy-3-Methyl- 
Glutaryl-Coenzym-A bzw. die gebildete Menge Mevalonat erhoht. 

25 Vorzugsweise betragt diese Erhohung der HMG-CoA-Reduktase-Aktivitat 
mindestens 5%, weiter bevorzugt mindestens 20%, weiter bevorzugt 
mindestens 50%, weiter bevorzugt mindestens 100%, bevorzugter 
mindestens 300%, noch bevorzugter mindestens 500%, insbesondere 
mindestens 600% der HMG-CoA-Reduktase-Aktivitat des Wildtyps. 

30 
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In einer bevorzugten Ausfuhrungsform erfolgt die Erhohung der HMG- 
CoA-Reduktase-Aktivitat gegenuber dem Wildtyp durch eine Erhohung der 
Genexpression einer Nukleinsaure codierend eine HMG-CoA-Reduktase. 

5 In einer besonders bevorzugten Ausfuhrungsform des erfindungsgemallen 
Verfahrens erfolgt die Erhohung der Genexpression einer Nukleinsaure 
codierend eine HMG-CoA-Reduktase indem man ein 
Nukleinsaurekonstrukt, enthaltend eine Nukleinsaure codierend eine 
HMG-CoA-Reduktase in den Organismus einbringt, deren Expression in 

10 dem Organismus, verglichen mit dem Wildtyp, einer reduzierten 
Regulation unterliegt. 

Unter einer reduzierten Regulation verglichen mit dem Wildtyp, wird eine 
im Vergleich zum vorstehend definierten Wildtyp verringerte, vorzugsweise 
15 keine Regulation auf Expressions- Oder Proteinebene verstanden. 

Die reduzierte Regulation kann vorzugsweise durch einen im 
Nukleinsaurekonstrukt mit der kodierenden Sequenz funktionell 
verknOpften Promotor erreicht werden, der in dem Organismus verglichen 
20 mit dem Wildtyp-Promoter einer reduzierten Regulation unterliegt. 

Beispielsweise unterliegen die Promotoren ptefl aus Blakeslea trispora 
und pgpdA aus Aspergillus nidulans nur einer reduzierten Regulation und 
sind daher insbesondere als Promotoren bevorzugt. 

25 

Diese Promotoren zeigen eine annahernd konstitutive Expression in 
Blakeslea trispora, so dass die transkriptionelle Regulation nicht mehr 
uber die Intermediate der Carotinoidbiosynthese ablauft. 

30 Die reduzierte Regulation kann in einer weiteren bevorzugten 
Ausfuhrungsform dadurch erreicht werden, dass man als Nukleinsaure 
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codierend eine HMG-CoA-Reduktase eine NukleinsSure verwendet, deren 
Expression in dem Organismus, verglichen mit der Organismus eigenen, 
orthologen Nukleinsaure, einer reduzierten Regulation unterliegt. 

5 Besonders bevorzugt ist die Verwendung einer Nukleinsaure, die nur den 
katalytischen Bereich der HMG-CoA-Reduktase kodiert (trunkierte (t- 
)HMG-CoA-Reduktase). Die fQr die Regulation verantwortliche Membran- 
Domane fehlt. Die verwendete Nukleinsaure unterliegt somit einer 
reduzierten Regulation und fuhrt zu einer Erhohung der Genexpression 

10 der HMG-CoA-Reduktase. 
In einer besonders bevorzugten Ausfuhrungsform bringt man 
Nukleinsauren in Blakeslea trispora ein, welche die Sequenz SEQ ID. NO. 
75 enthalten. 

15 Weitere Beispiele fur HMG-CoA-Reduktasen und damit auch fur die auf 
den katalytischen Bereich reduzierten t-HMG-CoA-Reduktasen bzw. die 
kodierenden Gene lassen sich beispielsweise aus verschiedenen 
Organismen, deren genomische Sequenz bekannt ist, durch 
Homologievergleiche der Sequenzen aus Datenbanken mit der SEQ ID. 

20 NO. 75 leicht auffinden. 

Weitere Beispiele fur HMG-CoA-Reduktasen und damit auch fur die auf 
den katalytischen Bereich reduzierten t-HMG-CoA-Reduktasen bzw. die 
kodierenden Gene lassen sich weiterhin beispielsweise ausgehend von 
25 der Sequenz SEQ ID. NO. 75 aus verschiedenen Organismen deren 
genomische Sequenz nicht bekannt ist, durch Hybridisierungs- und PCR- 
Techniken in an sich bekannter Weise leicht auffinden. 

In einer besonders bevorzugten AusfOhrungsform wird die reduzierte 
30 Regulation dadurch erreicht, dass man als Nukleinsaure codierend eine 
HMG-CoA-Reduktase eine Nukleinsaure verwendet, deren Expression in 
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dem Organismus, verglichen mit der Organismus eigenen, orthologen 
Nukleinsaure, einer reduzierten Regulation unterliegt und einen Promotor 
verwendet, der in dem Organismus, verglichen mit dem Wildtyp-Promoter 
einer reduzierten Regulation unterliegt. 

5 

Entsprechend wird in einer bevorzugten Variante der Erfindung durch die 
Transformation die Genexpression der Phytoendesaturase ausgeschaltet, 
so dass das von den Organismen produzierte Phytoen gewonnen werden 
kann. Der in der Transformation (i) eingesetzte Vector umfasst daher in 
10 einer Ausfuhrungsform der Erfindung bevorzugterweise eine Sequenz 
codierend fur ein Fragment des Gens der Phytoendesaturase, 
insbesondere carB aus Blakeslea trispora mit der SEQ ID NO: 69. 

Entsprechend wird in einer bevorzugten Variante der Erfindung durch 
15 Transformation die Genexpression der Lycopincyclase ausgeschaltet, so 
dass das von den Organismen produzierte Lycopin gewonnen werden 
kann. Der in der Transformation eingesetzte Vektor umfasst daher in einer 
Ausfuhrungsform der Erfindung bevorzugterweise eine Sequenz 
codierend f(ir ein Fragment des Gens der Lycopincyclase, insbesondere 
20 carR aus Blakeslea trispora s. (WO 03/027293). 

In einer weitereh bevorzugten Ausfuhrungsform werden die Organismen 
der Gattung Blakeslea beispielsweise in die Lage versetzt Xanthophylle, 
wie beispielsweise Zeaxanthin oder Astaxanthin herzustellen, indem die 
25 genetisch veranderten Organismen der Gattung Blakeslea im Vergleich 
zum Wildtyp eine Hydroxylase-Aktivitat und/oder eine Ketolase-Aktivitat 
besitzen. 

Der in der Transformation (i) eingesetzte Vector enthalt also in einer 
30 weiteren, bevorzugten Variante der Erfindung genetische Informationen, 
die nach Expression eine Ketolase- und/oder Hydroxylase-Aktivitat 
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entfalten, so dass die Organismen Zeaxanthin Oder Astaxanthin 
produzieren. 

Unter Ketolase-Aktivitat wird die Enzymaktivitat einer Ketolase 
5 verstanden. 

Unter einer Ketolase wird ein Protein verstanden, das die enzymatische 
Aktivitat aufweist, am, gegebenenfalls substituierten, p-lonon-Ring von 
Carotinoiden eine Keto-Gruppe einzuftihren. 

10 

Insbesondere wird unter einer Ketolase ein Protein verstanden, das 
die enzymatische Aktivitat aufweist, p-Carotin in Canthaxanthin 
umzuwandeln. 

15 Dementsprechend wird unter Ketolase-Aktivitat die in einer bestimmten 
Zeit durch das Protein Ketolase umgesetzte Menge p-Carotin bzw. 
gebildete Menge Canthaxanthin verstanden. 

Unter dem Begriff "Wildtyp" wird erfindungsgemafJ der entsprechende 
20 nicht genetisch veranderte Ausgangsorganismus der Gattung Blakesleaa 
verstanden. 

Je nach Zusammenhang kann unter dem Begriff "Organismus" der 
Ausgangsorganismus (Wildtyp) der Gattung Blakesleaa oder ein 
25 erfindungsgemafJer, genetisch veranderter Organismus der Gattung 
Blakesleaa oder beides verstanden werden. 

Vorzugsweise wird unter "Wildtyp" fur die Verursachung der Ketolase- 
Aktivitat und fiir die Verursachung der Hydroxylase-Aktivitat jeweils ein 
30 Referenzorganismus verstanden. 
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Dieser Referenzorganismus der Gattung Blakeslea ist Blakeslea trispora 
ATCC 14271 Oder ATCC 14272, die sich lediglich im Paarungstyp 
unterscheiden. 

5 Die Bestimmung der Ketolase-Aktivitat in erfindungsgemafJen genetisch 
veranderten Organismen der Gattung Blakesleaa und in Wildtyp- bzw. 
Referenzorganismen erfolgt vorzugsweise unter folgenden Bedingungen: 

Die Bestimmung der Ketolase-Aktivitat in Organismen der Gattung 
10 Blakeslea erfolgt in Anlehnung an die Methode von Fraser et al., (J. Biol. 
Chem. 272(10): 6128-6135, 1997). Die Ketolase-Aktivitat in Extrakten wird 
mit den Substraten beta-Carotin und Canthaxanthin in Gegenwart von 
Lipid (Sojalecithin) und Detergens (Natriumcholat) bestimmt. 
Substrat/Produkt-Verhaltnisse aus den Ketolase-Assays werden mittels 
15 HPLC ermittelt. 

Der erfindungsgem§fie genetisch veranderte Organismus der Gattung 
Blakesleaa weist in dieser, bevorzugten Ausfuhrungsform im Vergleich 
zum genetisch nicht veranderten Wildtyp eine Ketolase-Aktivitat auf und ist 
20 somit vorzugsweise in der Lage, transgen eine Ketolase zu exprimieren. 

In einer weiter bevorzugten Ausfuhrungsform erfolgt die Verursachung der 
Ketolase-Aktivitat in den Organismen der Gattung Blakesleaa durch 
Genexpression einer Nukleinsaure kodierend eine Ketolase. 

25 

In dieser bevorzugten AusfOhrungsform erfolgt die Verursachung der 
Genexpression einer Nukleinsaure kodierend eine Ketolase vorzugsweise 
durch Einbringen von Nukleinsauren, die Ketolasen kodieren in die 
Ausgangsorganismus der Gattung Blakesleaa. 
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Dazu kann prinzipiell jedes Ketolase-Gen, also jede Nukleinsauren die 
eine Ketolase codiert verwendet werden. 

Alle in der Beschreibung erwahnten Nukleinsauren konnen beispielsweise 
5 eine RNA-, DNA- oder cDNA-Sequenz sein. 

Bet genomischen Ketolase-Sequenzen aus eukaryontischen Quellen, die 
Introns enthalten, sind fur den Fall das der Wirtsorganismus der Gattung 
Blakesleaa nicht in der Lage ist oder nicht in die Lage versetzt werden 
10 kann, die entsprechenden Ketolase zu exprimieren, bevorzugt bereits 
prozessierte Nukleinsauresequenzen, wie die entsprechenden cDNAs zu 
verwenden. 

Beispiele fur Nukleinsauren, kodierend eine Ketolase und die 
15 entsprechenden Ketolasen, die im erfindungsgemaRen Verfahren 
verwendet werden konnen sind beispielsweise Sequenzen aus: 

Haematoccus pluvialis, insbesondere aus Haematoccus pluvialis Flotow 
em. Wilie (Accession NO: X86782; Nukleinsaure: SEQ ID NO: 11, Protein 
20 SEQ ID NO: 12), 

Haematoccus pluvialis, NIES-144 (Accession NO: D45881; Nukleinsaure: 
SEQ ID NO: 13, Protein SEQ ID NO: 14), 

25 Agrobacterium aurantiacum (Accession NO: D58420; Nukleinsaure: SEQ 
ID NO: 15, Protein SEQ ID NO: 16), 

Alicaligenes spec. (Accession NO: D58422; Nukleinsaure: SEQ ID NO: 17, 
Protein SEQ ID NO: 18), 

30 
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Paracoccus marcusii (Accession NO: Y15112; Nukleinsaure: SEQ ID NO: 
19, Protein SEQ ID NO: 20), 

Synechocystis sp. Strain PC6803 (Accession NO: NP442491; 
5 Nukleinsaure: SEQ ID NO: 21 , Protein SEQ ID NO: 22), 

Bradyrhizobium sp. (Accession NO: AF218415; Nukleinsaure: SEQ ID NO: 
23, Protein SEQ ID NO: 24), 

10 Nostoc sp. Strain PCC7120 (Accession NO: AP003592, BAB74888; 
Nukleinsaure: SEQ ID NO: 25, Protein SEQ ID NO: 26), 

Nostoc punctiforme ATTC 29133, Nukleinsaure: Acc.-No. 
NZ_AABC01000195, Basenpaar 55,604 bis 55,392 (SEQ ID NO: 27); 
15 Protein: Acc.-No. ZP_001 11258 (SEQ ID NO: 28) (als putatives Protein 
annotiert) oder 

Nostoc punctiforme ATTC 29133, Nukleinsaure: Acc.-No. 
NZ_AABC01000196, Basenpaar 140,571 bis 139,810 (SEQ ID NO: 29), 
20 Protein: (SEQ ID NO: 30) (nicht annotiert). 

Weitere naturliche Beispiele fur Ketolasen und Ketolase-Gene, die im 
erfindungsgemafien Verfahren verwendet werden konnen, lassen sich 
beispielsweise aus verschiedenen Organismen, deren genomische 
25 Sequenz bekannt ist, durch Identitatsvergleiche der 
Aminosauresequenzen oder der entsprechenden ruckubersetzten 
Nukleinsauresequenzen aus Datenbanken mit den vorstehend 
beschriebenen Sequenzen und insbesondere mit den Sequenzen 
SEQ ID NO: 12 und/oder 26 und/oder 30 leicht auffinden. 

30 
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Weitere nattlrliche Beispiele fur Ketolasen und Ketolase-Gene lassen sich 
weiterhin ausgehend von den vorstehend beschriebenen 
Nukleinsauresequenzen, insbesondere ausgehend von den Sequenzen 
SEQ ID NO: 12 und/oder 26 und/oder 30 aus verschiedenen Organismen, 
5 deren genomische Sequenz nicht bekannt ist, durch 
Hybridisierungstechniken in an sich bekannter Weise leicht auffinden. 

Die Hybridisierung kann unter moderaten (geringe Stringenz) oder 
vorzugsweise unter stringenten (hohe Stringenz) Bedingungen erfolgen. 

10 

Solche Hybridisierungsbedingungen sind beispielsweise bei Sambrook, J., 
Fritsch, E.F., Maniatis, T., in: Molecular Cloning (A Laboratory Manual), 2. 
Auflage, Cold Spring Harbor Laboratory Press, 1989, Seiten 9.31-9.57 
oder in Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. 
15 (1989), 6.3.1-6.3.6 beschrieben. 

Beispielhaft konnen die Bedingungen wahrend des Waschschrittes 
ausgewahlt sein aus dem Bereich von Bedingungen begrenzt von solchen 
mit geringer Stringenz (mit 2X SSC bei 50°C) und solchen mit hoher 
20 Stringenz (mit 0.2X SSC bei 50°C, bevorzugt bei 65°C) (20X SSC: 0,3 M 
Natriumcitrat, 3 M Natriumchlorid, pH 7.0). 

Daruberhinaus kann die Temperatur wahrend des Waschschrittes von 
moderaten Bedingungen bei Raumtemperatur, 22°C, bis zu stringenten 
25 Bedingungen bei 65°C angehoben werden. 

Beide Parameter, Salzkonzentration und Temperatur, konnen gleichzeitig 
variiert werden, auch kann einer der beiden Parameter konstant gehalten 
und nur der andere variiert werden. Wahrend der Hybridisierung konnen 
30 auch denaturierende Agenzien wie zum Beispiel Formamid oder SDS 
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eingesetzt werden. In Gegenwart von 50% Formamid wird die 
Hybridisierung bevorzugt bei 42°C ausgefOhrt. 

Einige beispielhafte Bedingungen fur Hybridisierung und Waschschritt sind 
5 infolge gegeben: 



(1) Hybridiserungsbedingungen mit zum Beispiel 

(1) 4X SSC bei 65°C, Oder 

(ii) 6X SSC bei 45°C, oder 

10 (iii) 6X SSC bei 68°C, 100 mg/ml denaturierter Fischsperma-DNA, oder 

(iv) 6X SSC, 0,5 % SDS, 100 mg/ml denaturierte, fragmentierte 
Lachssperma-DNA bei 68°C, oder 

(v) 6XSSC, 0,5 % SDS, 100 mg/ml denaturierte, fragmentierte 
Lachssperma-DNA, 50 % Formamid bei 42°C, oder 

15 (vi) 50 % Formamid, 4X SSC bei 42°C, oder 

(vii) 50 % (vol/vol) Formamid, 0,1 % Rinderserumalbumin, 0,1 % Ficoll, 
0.1 % Polyvinylpyrrolidon, 50 mM Natriumphosphatpuffer pH 6,5, 
750 mM NaCI, 75 mM Natriumcitrat bei 42°C, oder 

(viii) 2X oder 4X SSC bei 50°C (moderate Bedingungen), oder 

20 (ix) 30 bis 40 % Formamid, 2X oder 4X SSC bei 42°C (moderate 
Bedingungen). 

(2) Waschschritte fUr jeweils 10 Minuten mit zum Beispiel 

(i) 0,015 M NaCI/0,0015 M Natriumcitrat/0,1 % SDS bei 50°C, oder 
25 (ii) 0.1X SSC bei 65°C, oder 

(iii) 0.1X SSC, 0,5 % SDS bei 68°C, oder 

(iv) 0.1X SSC, 0,5 % SDS, 50 % Formamid bei 42°C, oder 

(v) 0.2X SSC, 0,1 % SDS bei 42°C, oder 

(vi) 2X SSC bei 65°C (moderate Bedingungen). 

30 
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In einer bevorzugten AusfQhrungsform der erfindungsgemaften genetisch 
veranderten Organismen der Gattung Blakeslea bringt man Nukleinsauren 
ein, die ein Protein kodieren, enthaltend die Aminosauresequenz SEQ ID 
NO: 12 oder eine von dieser Sequenz durch Substitution, Insertion oder 

5 Deletion von Aminosauren abgeleitete Sequenz, die eine Identitat von 
mindestens 20 %, vorzugsweise mindestens 30 %, bevorzugter 
mindestens 40 %, bevorzugter mindestens 50 %, bevorzugter mindestens 
60 %, bevorzugter mindestens 70 %, bevorzugter mindestens 80 %, 
besonders bevorzugt mindestens 90%, insbesondere 91%, 92%, 93%, 

10 94%, 95%, 96%, 97%, 98%, 99% auf Aminosaureebene mit der Sequenz 
z SEQ ID NO: 12 und die enzymatische Eigenschaft einer Ketolase 
aufweist. 

Dabei kann es sich um eine naturliche Ketolase-Sequenz handeln, die wie 
15 vorstehend beschrieben durch Identitatsvergleich der Sequenzen aus 
anderen Organismen gefunden werden kann oder um eine kunstliche 
Ketolase-Sequenz die ausgehend von der Sequenz SEQ ID NO: 12 durch 
kunstliche Variation, beispielsweise durch Substitution, Insertion oder 
Deletion von Aminosauren abgewandelt wurde. 

20 

In einer weiteren, bevorzugten AusfQhrungsform der erfindungsgemaBen 
Verfahren bringt man Nukleinsauren ein die ein Protein kodieren, 
enthaltend die Aminosauresequenz SEQ ID NO: 26 oder eine von dieser 
Sequenz durch Substitution, Insertion oder Deletion von Aminosauren 

25 abgeleitete Sequenz, die eine Identitat von mindestens 20 %, 
vorzugsweise mindestens 30 %, bevorzugter mindestens 40 %, 
bevorzugter mindestens 50 %, bevorzugter mindestens 60 %, bevorzugter 
mindestens 70 %, bevorzugter mindestens 80 %, besonders bevorzugt 
mindestens 90 % insbesondere 91%, 92%, 93%, 94%, 95%, 96%, 97%, 

30 98%, 99% auf Aminosaureebene mit der Sequenz SEQ ID NO: 26 und die 
enzymatische Eigenschaft einer Ketolase aufweist. 
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Dabei kann es sich urn eine natiirliche Ketolase-Sequenz handeln, die, 
wie vorstehend beschrieben, durch Identitatsvergleich der Sequenzen aus 
anderen Organismen gefunden werden kann oder urn eine kunstiiche 
5 Ketolase-Sequenz die ausgehend von der Sequenz SEQ ID NO: 26 durch 
kunstiiche Variation, beispielsweise durch Substitution, Insertion Oder 
Deletion von Aminosauren abgewandelt wurde. 

In einer weiteren, bevorzugten Ausfuhrungsform der erfindungsgemallen 
10 Verfahren bringt man Nukleinsauren ein die ein Protein kodieren, 
enthaltend die Aminosauresequenz SEQ ID NO: 30 oder eine von dieser 
Sequenz durch Substitution, Insertion oder Deletion von Aminosauren 
abgeleitete Sequenz, die eine Identity von mindestens 20 %, 
vorzugsweise mindestens 30 %, bevorzugter mindestens 40 %, 
15 bevorzugter mindestens 50 %, bevorzugter mindestens 60 %, bevorzugter 
mindestens 70 %, bevorzugter mindestens 80 %, besonders bevorzugt 
mindestens 90 %, insbesondere 91%, 92%, 93%, 94%, 95%, 96%, 97%, 
98%, 99% auf Aminosaureebene mit der Sequenz SEQ ID NO: 30 und die 
enzymatische Eigenschaft einer Ketolase aufweist. 

20 

Dabei kann es sich urn eine nattiriiche Ketolase-Sequenz handeln, die, 
wie vorstehend beschrieben, durch Identitatsvergleich der Sequenzen aus 
anderen Organismen gefunden werden kann oder urn eine kunstiiche 
Ketolase-Sequenz die ausgehend von der Sequenz SEQ ID NO: 30 durch 
25 kOnstliche Variation, beispielsweise durch Substitution, Insertion oder 
Deletion von Aminosauren abgewandelt wurde. 

Unter dem Begriff "Substitution" ist in der Beschreibung der Austausch 
einer oder mehrerer Aminosauren durch eine oder mehrere Aminosauren 
30 zu verstehen. Bevorzugt werden sog. konservative Austausche 
durchgefuhrt, bei denen die ersetzte Aminosaure eine ahnliche 
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Eigenschaft hat wie die urspriingliche Aminosaure, beispielsweise 
Austausch von Glu durch Asp, Gin durch Asn, Val durch lie, Leu durch lie, 
Ser durch Thr. 

5 Deletion 1st das Ersetzen einer Aminosaure durch eine direkte Bindung. 
Bevorzugte Positionen fur Deletionen sind die Termini des Polypeptids 
und die VerknOpfungen zwischen den einzelnen Proteindomanen. 

Insertionen sind EinfQgungen von Aminosauren in die Polypeptidkette, 
10 wobei formal eine direkte Bindung durch ein Oder mehrere Aminosauren 
ersetzt wird. 

Unter Identitat zwischen zwei Proteinen wird die Identitat der Aminosauren 
uber die jeweils gesamte Proteinlange verstanden, insbesondere die 
15 Identitat die durch Vergleich mit Hilfe der Lasergene Software der Firma 
DNASTAR, inc. Madison, Wisconsin (USA) unter Anwendung der Clustal 
Methode (Higgins DG, Sharp PM. Fast and sensitive multiple sequence 
alignments on a microcomputer. Comput Appl. Biosci. 1989 Apr;5(2):151- 
1) unter Einstellung folgender Parameter berechnet wird: 

20 

Multiple alignment parameter: 



Gap penalty 10 

Gap length penalty 10 
Pairwise alignment parameter 

25 K-tuple 1 

Gap penalty 3 

Window 5 

Diagonals saved 5 



30 



Unter einem Protein, das eine Identitat von mindestens 20 % 
auf Aminosaureebene mit der Sequenz SEQ ID NO: 12 oder 26 Oder 30 
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aufweist, wird dementsprechend ein Protein verstanden, das bei einem 
Vergleich seiner Sequenz mit der Sequenz SEQ ID NO: 12 oder 26 oder 
30, insbesondere nach obigen Programmlogarithmus mit obigem 
Parametersatz eine Identitat von mindestens 20 %, bevorzugt 80,%, 85%, 
5 besonders 90%, insbesondere 95% aufweist. 

Geeignete Nukleinsauresequenzen sind beispielsweise durch 
Ruckubersetzung der Polypeptidsequenz gemali dem genetischen Code 
erhaltlich. 

10 

Bevorzugt werden dafOr solche Codons verwendet, die entsprechend der 
Blakesleaaspezrfischen codon usage haufig verwendet werden. Die codon 
usage lasst sich anhand von Computerauswertungen anderer, bekannter 
Gene von Organismen der Gattung Blakesleaa leicht ermitteln. 

15 

In einer besonders bevorzugten Ausfuhrungsform bringt man eine 
Nukleinsaure, enthaltend die Sequenz SEQ ID NO: 11 in die Organismus 
der Gattung ein. 

20 In einer weiteren, besonders bevorzugten Ausfuhrungsform bringt man 
eine Nukleinsaure, enthaltend die Sequenz SEQ ID NO: 25 in die 
Organismus der Gattung ein. 

In einer weiteren, besonders bevorzugten Ausfuhrungsform bringt man 
25 eine Nukleinsaure, enthaltend die Sequenz SEQ ID NO: 29 in die 
Organismus der Gattung ein. 

Alle vorstehend erwahnten Ketolase-Gene sind weiterhin in an sich 
bekannter Weise durch chemische Synthese aus den Nukleotidbausteinen 
30 wie beispielsweise durch Fragmentkondensation einzelner uberlappender, 
komplementarer Nukleinsaurebausteine der Doppelhelix herstellbar. Die 
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chemische Synthese von Oligonukleotiden kann beispielsweise, in 
bekannter Weise, nach der Phosphoamiditmethode (Voet, Voet, 2. 
Auflage, Wiley Press New York, S. 896-897) erfolgen. Die Anlagerung 
synthetischer Oligonukleotide und AuffQIIen von Lucken mithilfe des 
5 Klenow-Fragmentes der DNA-Polymerase und Ligationsreaktionen sowie 
allgemeine Klonierungsverfahren werden in Sambrook et al. (1989), 
Molecular cloning: A laboratory manual, Cold Spring Harbor Laboratory 
Press, beschrieben. 

10 Der in der Transformation (i) eingesetzte Vector umfasst daher in einer 
AusfQhrungsform der Erfindung bevorzugterweise eine Sequenz 
codierend fur eine Ketolase, insbesondere der Ketolase Nostoc 
punctiforme aus mit der SEQ ID NO: 72. 

15 Unter Hydroxylase-Aktivitat die Enzymaktivitat einer Hydroxylase 
verstanden. 

Unter einer Hydroxylase wird ein Protein verstanden, das die 
enzymatische Aktivitat aufweist, am, gegebenenfalls substituierten, p- 
20 lonon-Ring von Carotinoiden eine Hydroxy-Gruppe einzufQhren. 

Insbesondere wird unter einer Hydroxylase ein Protein verstanden, das 
die enzymatische Aktivitat aufweist, p-Carotin in Zeaxanthin oder 
Cantaxanthin in Astaxanthin umzuwandeln. 

25 

Dementsprechend wird unter Hydroxyase-Aktivitat die in einer bestimmten 
Zeit durch das Protein Hydroxylase umgesetzte Menge p-Carotin oder 
Cantaxanthin bzw. gebildete Menge Zeaxanthin oder Astaxanthin 
verstanden. 

30 
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Bei einer erhohten Hydroxylase-Aktivitat gegenQber dem Wildtyp wird 
somit im Vergleich zum Wildtyp in einer bestimmten Zeit durch das Protein 
Hydroxylase die umgesetzte Menge p-Carotin oder Canthaxantin bzw. die 
gebildete Menge Zeaxanthin oder Astaxanthin erhdht. 

5 

Vorzugsweise betragt diese Erhohung der Hydroxylase-Aktivitat 
mindestens 5 %, weiter bevorzugt mindestens 20 %, weiter bevorzugt 
mindestens 50%, weiter bevorzugt mindestens 100%, bevorzugter 
mindestens 300 %, noch bevorzugter mindestens 500 %, insbesondere 
10 mindestens 600 % der Hydroxylase-Aktivitat des Wildtyps. 

Die Bestimmung der Hydroxylase-Aktivitat in erfindungsgemalien 
genetisch veranderten Organismen und in Wildtyp- bzw. Referenz- 
Organismen erfolgt vorzugsweise unter folgenden Bedingungen: 

15 

Die Aktivitat der Hydroxylase wird nach Bouvier et al. (Biochim. Biophys. 
Acta 1391 (1998), 320-328) in vitro bestimmt. Es wird zu einer bestimmten 
Menge an Organismenextrakt Ferredoxin, Ferredoxin-NADP 
Oxidoreductase, Katalase, NADPH sowie beta-Carotin mit Mono- und 
20 Digalaktosylglyzeriden zugegeben. 

Besonders bevorzugt erfolgt die Bestimmung der Hydroxylase-Aktivitat 
unter folgenden Bedingungen nach Bouvier, Keller, d'Harlingue und 
Camara (Xanthophyll biosynthesis: molecular and functional 
25 characterization of carotenoid hydroxylases from pepper fruits (Capsicum 
annuum L.; Biochim. Biophys. Acta 1391 (1998), 320-328): 

Der in-vitro Assay wird in einem Volumen von 0,250 ml Volumen 
durchgefuhrt. Der Ansatz enthalt 50 mM Kaliumphosphat (pH 7,6), 0,025 
30 mg Ferredoxin von Spinat, 0,5 Einheiten Ferredoxin-NADP+ 
Oxidoreduktase von Spinat, 0,25 mM NADPH, 0,010 mg beta-Carotin (in 



WO 2004/063358 



PCT/EP2004/000100 



27 

0,1 mg Tween 80 emulgiert), 0,05 mM einer Mischung von Mono- und 
Digalaktosyiglyzeriden (1:1), 1 Einheit Katalyse, 200 Mono- und 
Digalaktosylglyzeriden, (1:1), 0,2 mg Rinderserumalbumin und 
Organismenextrakt in unterschiedlichem Volumen. Die 
5 Reaktionsmischung wird 2 Stunden bei 30°C inkubiert. Die 
Reaktionsprodukte werden mit organischem Losungsmittel wie THF, 
Aceton Oder Chloroform/Methanol (2:1) ^extrahiert und mittels HPLC 
bestimmt. 

10 Besonders bevorzugt erfolgt die Bestimmung der Hydroxylase-Aktivitat 
unter folgenden Bedingungen nach Bouvier, d'Harlingue und Camara 
(Molecular Analysis of carotenoid cyclae inhibition; Arch. Biochem. 
Biophys. 346(1) (1997) 53-64): 

15 Der in-vitro Assay wird in einem Volumen von 250 ul Volumen 
durchgefuhrt. Der Ansatz enthalt 50 mM Kaliumphosphat 
(pH 7,6),unterschiedliche Mengen an Organismenextrakt, 20 nM Lycopin, 
250 ug an chromoplastidarem Stromaprotein aus Paprika, 0,2 mM 
NADP+, 0.2 mM NADPH und 1 mM ATP. NADP/NADPH und ATP werden 

20 in 10 ml Ethanol mit 1 mg Tween 80 unmittelbar vor der Zugabe zum 
Inkubationsmedium gelost. Nach einer Reaktionszeit von 60 Minuten bei 
30°C wird die Reaktion durch Zugabe von Chloroform/Methanol (2:1) 
beendet. Die in Chloroform extrahierten Reaktionsprodukte werden mittels 
HPLC analysiert. 

25 

Ein altemativer Assay mit radioaktivem Substrat ist beschrieben in Fraser 
und Sandmann (Biochem. Biophys. Res. Comm. 185(1) (1992) 9-15). 

Die Erhohung der Hydroxylase-Aktivitat kann durch verschiedene Wege 
30 erfolgen, beispielsweise durch Ausschalten von hemmenden 
Regulationsmechanismen auf Expressions- und Proteinebene oder durch 
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Erhohung der Genexpression von Nukleinsauren kodierend eine 
Hydroxylase gegenuber dem Wildtyp. 

Die ErhShung der Genexpression der Nukleinsauren kodierend eine 
5 Hydroxylase gegenuber dem Wildtyp kann ebenfalls durch verschiedene 
Wege erfolgen, beispielsweise durch Induzierung des Hydroxylase-Gens 
durch Aktivatoren oder durch Einbringen von einer oder mehrerer 
Hydroxylase-Genkopien, also durch Einbringen mindestens einer 
Nukleinsaure kodierend eine Hydroxylase in denb Organismus der 
10 Gattung Blakesleaa. 

In einer bevorzugten Ausfuhrungsform erfolgt die Erhohung der 
Genexpression einer Nukleinsaure kodierend eine Hydroxylase durch 
Einbringen von mindestens einer Nukleinsaure kodierend eine 
15 Hydroxylase in den Organismus der Gattung Blakesleaa. 

Dazu kann prinzipiell jedes Hydroxylase-Gen, also jede Nukleinsaure, die 
eine Hydroxylase codiert, verwendet werden. 

20 Bei genomischen Hydroxylase-Sequenzen aus eukaryontischen Quellen, 
die Introns enthalten, sind fur den Fall, dass der Wirtsorganismus nicht in 
der Lage ist oder nicht in die Lage versetzt werden kann, die 
entsprechende Hydroxylase zu exprimieren, bevorzugt bereits 
prozessierte Nukleinsauresequenzen, wie die entsprechenden cDNAs zu 

25 verwenden. 

Ein Beispiel fiirein Hydroxylase-Gen ist eine Nukleinsaure, kodierend eine 
Hydroxylase aus Haematococcus pluvialis mit der Accession No. 
AX038729 (WO 0061764; Nukleinsaure: SEQ ID NO: 31, Protein: SEQ ID 
30 NO: 32), aus Erwinia uredovora 20D3 (ATCC 19321, Accession No. 
D90087; Nukleinsaure: SEQ ID NO: 33, Protein: SEQ ID NO: 34) oder 
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Hydroxylase aus Thermus thermophilus (DE 102 34 126.5) kodiert durch 
die Sequenz mit der SEQ ID NO 76. 

Weitere Hydroxylasen werden von den Nukleinsauren mit den folgenden 

5 Accession Nummern kodiert 

|emb|CAB55626. 1 , CAA70427.1 , CAA70888.1 , CAB55625. 1 , 
AF499108_1, AF315289_1, AF296158_1, AAC49443.1, NP_194300.1, 
NP_200070.1, AAG10430.1, CAC06712.1, AAM88619.1, CAC95130.1, 
AAL80006.1, AF1 62276_1, AAOS3295.1, AAN85601.1, CRTZ_ERWHE, 

10 CRTZ_PANAN, BAB79605.1, CRTZ_ALCSP, CRTZ_AGRAU, 
CAB56060.1, ZP_00094836.1, AAC44852.1, BAC77670.1, NPJ745389.1, 
NPJ344225.1 , NP_849490.1 , ZP_00087019.1 , NP_503072.1 , 
NP_852012.1, NP_1 15929.1, ZP_0Q013255.1 

15 In den erfindungsgemalJen bevorzugten transgenen Organismen der 
Gattung Blakeslea iiegt also in dieser bevorzugten Ausfuhrungsform 
gegenOber dem Wildtyp mindestens ein Hydroxylase-Gen vor. 

In dieser bevorzugten AusfQhrungsform weist der genetisch veranderte 
20 Organismus beispielsweise mindestens eine exogene Nukleinsaure, 
kodierend eine Hydroxylase auf. 

Bevorzugt verwendet man in vorstehend beschriebener bevorzugter 
Ausfuhrungsform als Hydroxylase-Gene Nukleinsauren, die Proteine 

25 kodieren, enthaltend die Aminosauresequenz SEQ ID NO: 32, 34 oder 
kodiert durch die Sequenz mit der SEQ ID NO 76 oder eine von dieser 
Sequenz durch Substitution, Insertion oder Deletion von Aminosauren 
abgeleitete Sequenz, die eine Identitat - von mindestens 30 %, 
vorzugsweise mindestens 50 %, bevorzugter mindestens 70%, noch 

30 bevorzugter mindestens 80 %, am bevorzugtesten mindestens 90%, 
insbesondere 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% auf 
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Aminosaureebene mit der Sequenz SEQ. ID. NO: 32, 34 oder kodiert 
durch die Sequenz mit der SEQ ID NO 76 und die die enzymatische 
Eigenschaft einer Hydroxylase aufweisen. 

5 Weitere Beispiele fur Hydroxylasen und Hydroxylase-Gene lassen sich 
beispielsweise aus verschiedenen Organismen, deren genomische 
Sequenz bekannt ist, wie vorstehend beschrieben, durch 
Homologievergleiche der Aminosauresequenzen oder der entsprechenden 
ruckubersetzten Nukleinsauresequenzen aus Datenbanken mit der SEQ 

10 ID. NO: 31 , 33 oder 76 leicht auffinden. 

Weitere Beispiele fur Hydroxylasen und Hydroxylase-Gene lassen sich 
weiterhin beispielsweise ausgehend von der Sequenz SEQ ID NO: 31, 33 
oder 76 aus verschiedenen Organismen deren genomische Sequenz nicht 
15 bekannt ist, wie vorstehend beschrieben, durch Hybridisierungs- und 
PCR-Techniken in an sich bekannter Weise leicht auffinden. 

In einer weiter besonders bevorzugten Ausfuhrungsform werden zur 
Erhdhung der Hydroxylase-Aktivitat Nukleinsauren in Organismen 
20 eingebracht, die Proteine kodieren, enthaltend die Aminosauresequenz 
der Hydroxylase der Sequenz SEQ ID NO: 32, 34 oder kodiert durch die 
Sequenz mit der SEQ ID NO 76. 

Geeignete Nukleinsauresequenzen sind beispielsweise durch 
25 Ruckiibersetzung der Polypeptidsequenz gemaR dem genetischen Code 
erhaltlich. 

Bevorzugt werden dafiir solche Codons verwendet, die entsprechend der 
Organismenspezifischen codon usage haufig verwendet werden. Die 
30 codon usage lasst sich anhand von Computerauswertungen anderer, 
bekannter Gene der betreffenden Organismen leicht ermitteln. 
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In einer besonders bevorzugten AusfGhrungsform bringt man eine 
Nukleinsaure, enthaltend die Sequenz SEQ. ID. NO: 31, 33 Oder 76 in den 
Organismus ein. 

5 

Alle vorstehend erwahnten Hydroxylase-Gene sind weiterhin in an sich 
bekannter Weise durch chemische Synthese aus den Nukleotidbausteinen 
wie beispielsweise durch Fragmentkondensation einzelner uberiappender, 
komplementarer Nukleinsaurebausteine der Doppelhelix herstellbar. Die 

10 chemische Synthese von Oligonukleotiden kann beispielsweise, in 
bekannter Weise, nach der Phosphoamiditmethode (Voet, 2. Auflage, 
Wiley Press New York, Seite 896-897) erfolgen. Die Anlagerung 
synthetischer Oligonukleotide und Auffullen von Lucken mithilfe des 
Klenow-Fragmentes der DNA-Polymerase und Ligationsreaktionen sowie 

15 allgemeine Kionierungsverfahren werden in Sambrook et al. (1989), 
Molecular cloning: A laboratory manual, Cold Spring Harbor Laboratory 
Press, beschrieben. 

Der in der Transformation (i) eingesetzte Vector umfasst daher in weiteren 
20 Ausfuhrungsformen der Erfindung bevorzugterweise eine Sequenz 
codierend fur eine Hydroxlase, insbesondere eine Hydroxlase aus 
Haematococcus pluvialis mit der SEQ ID NO: 70 oder eine Hydroxlase aus 
Erwinia uredova mit der SEQ ID NO: 71. oder eine Hydroxylase aus 
Thermus thermophilus kodiert durch die Sequenz mit der SEQ ID NO 76. 

25 

Der in der Transformation (i) eingesetzte Vector enthalt vorzugsweise 
femer die Expression regelnde und unterstutzende Bereiche, 
insbesondere Promotoren und Terminatoren. 

30 Der in der Transformation (i) eingesetzte Vector enthalt vorzugsweise den 
gpd und/oder den ptefl Promoter und/oder den trpC Terminator. Diese 
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haben sich zur Transformation der Blakeslea besonders bewahrt. Auch 
der Einsatz von dem Fachmann gelaufigen "inverted repeats" (IR, Rompp 
Lexikon der Biotechnologie 1992, Thieme Veriag Stuttgart, Seite 407 
"Invers repetitive Sequenzen") zur Regelung der Expression bzw. 
5 Transkription liegt im Rahmen der Erfindung. 

Vorteilhafterweise weist der im Vector eingesetzte gpd Promotor die 
Sequenz SEQ ID NO: 1 auf. Vorteilhafterweise weist der im Vector 
eingesetzte trpC Terminator die Sequenz SEQ ID NO: 2 auf. 
10 Vorteilhafterweise weist der im Vector eingesetzte ptefl Promotor die 
Sequenz SEQ ID NO: 35 auf. 

Insbesondere werden dabei der gpd Promotor und der trpC Terminator 
aus Aspergillus nidulans und der ptefl Promotor aus Blakeslea trispora 
15 eingesetzt. 

Insbesondere enthalt der in der Transformation (i) eingesetzte Vector ein 
Resistenzgen. Bevorzugterweise handelt es sich um ein Hygromycin- 
Resistenzgen (hph), insbesondere das aus E. coli. Dieses Resistenzgen 
20 hat sich bei dem Nachweis der Transformation und Selektion der Zellen 
als besonders geeignet herausgestellt. 

Als Promotor fur hph wird also bevorzugt p-gpdA, der Promotor der 
Glycerinaldehyd-3-phosphatdehydrogenase aus Aspergillus nidulans 
25 genutzt. Als Terminator ftir hph wird bevorzugt t-trpC, der Terminator des 
Gens trpC, codierend fOr Anthranilatsynthasekomponenten aus 
Aspergillus nidulans genutzt. 

Als Vectoren haben sich Abkommlinge des pBinAHyg Vectors als 
30 besonders geeignet herausgestellt. Der zur Transformation eingesetzte 
Vector umfasst also bevorzugterweise die SEQ ID NO: 3. 
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Hinzu kommen je nach gewUnschtem Carotinoid Oder dessen Vorstufe 
eine Sequenz codierend fur eine Hydroxylase, Ketolase, 
Phytoendesaturase usw. wie diese zuvor beschrieben wurden. Die 
Vectoren umfassen also in einer AusfQhrugsform der Erfndung die 

5 Sequenz SEQ ID NO: 69 codierend fur die Phytoendesaturase. Die 
Vectoren umfassen ferner in einer weiteren AusfQhrugsform der Erfndung 
die Sequenz SEQ ID NO: 72 codierend fur eine Ketolase. Die Vectoren 
umfassen weiter in einer weiteren Ausfuhrugsform der Erfndung die 
Sequenz SEQ ID NO: 70 Oder 71 oder 76 codierend fDr eine Hydoxylase. 

10 Entsprechende Kombinationen der zuvorgenannten Sequenzen liegen 
ebenso im Rahmen der Erfindung. So umfasst der Vector in einer 
Ausfuhrungsform sowohl eine Sequenz SEQ ID NO: 72 codierend fur eine 
Ketolase als auch die Sequenz SEQ ID NO: 70 oder 71 oder 76 codierend 
fur eine Hydoxylase und ermoglicht so die Herstellung von Astaxanthin. 

15 

Insbesondere sind Vectoren ausgewahlt aus der Gruppe bestehend aus 
den SEQ ID NO: 37 bis 51 und 62 im Rahmen der Erfindung einsetzbar. 

Mit dem erfindungsgemaBen Verfahren sind gentechnisch veranderte 
20 Organismen Blakeslea, insbesondere der Art Blakeslea trispora bzw. aus 
ihnen gebildetes Mycel erhaltlich. 

Die genetisch veranderten Organismen konnen zur Produktion von 
Carotinoiden, Xanthophyllen oder deren Vorstufen, insbesondere Phytoen, 
25 Bixion, Astaxanthin, Zeaxanthin und Canthaxanthin verwendet werden. 
Auch konnen neue, im Wildtyp natOrlicherweise nicht vorkommende 
Carotinoide durch Einbringung der entsprechenden genetischen 
Information von den gezielt genetisch veranderten Zellen bzw. dem durch 
sie gebildeten Mycel erzeugt und anschlieBend isoliert werden. 

30 
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Bevorzugterweise ist die Gewlnnung von Carotinoiden oder deren 
Vorstufen mit den gezielt genetisch veranderten Zellen bzw. das durch sie 
gebildete Mycel moglich. 

5 Wird die gentechnische Veranderung nur in Zellen eines der 
vorkommenden Paarungstypen (bei Blakeslea trispora (+) oder (-)) 
durchgefUhrt, so wird zur Kultivierung der entsprechend andere, nicht 
veranderte Paarungstyp zugesetzt, da so eine gute Produktion der 
Carotinoide oder deren Vorstufen aufgrund der von dem zweiten, nicht 

10 veranderten Paarungstyp abgegebenen Substanzen (z. B. Trisporsauren) 
zu erreichen ist. Vorteilhafterweise wird jedoch die gentechnische 
Ver§nderung in Zellen beider Paarungstypen vorgenommen und diese 
zusammen kultiviert. Hierdurch wird ein besonders gutes Wachstum und 
eine optimale Produktion der Carotinoiden oder deren Vorstufen erreicht. 

15 Auch eine (kUnstliche) Zugabe der Trisporsauren ist moglich und sinnvoll. 

Trisporsauren sind Sexualhormone in Mucorales Pilzen, wie Blakeslea, 
welche die Bildung von Zygophoren und die Produktion von B-Carotin 
stimulieren (van den Ende 1968, J. Bacteriol. 96:1298 - 1303, Austin et al. 
20 1 969, Nature 223:1178 - 1179, Reschke Tetrahedron Lett. 29:3435 - 
3439, van den Ende 1970, J. Bacteriol. 101:423 -.428). 

Die Erfindung wird nachfolgend an Hand von Beispielen nSher ausgefUhrt. 

25 Material und Methoden 

Molekulargenetische Arbeiten wurden, wenn nicht anders beschrieben, 
nach den Methoden in Current Protocols in Molecular Biology (Ausubel et 
al., 1999, John Wiley & Sons) durchgefUhrt. 

30 Stamme und Wachstumsbedingungen 
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Die Blakeslea trispora Stamme ATCC 14271 (Paarungstyp(+)) und 
ATCC14272 (Paarungstyp (-)) wurden von der American Type Culture 
Collection erhalten. Die Anzucht von B. trispora erfolgte in MEP-Medium 
(Malzextrakt-Pepton-Medium): 30 g/l Malzextrakt (Difco), 3 g/l Pepton 
5 (Soytone, Difco), 20 g/l Agar, Einstellung pH 5,5, ad 1000 ml mit H 2 0 bei 
28 °C. 

Die Anzucht von Agrobacterium tumefaciens LBA4404 erfolgte nach 
Hoekema et al. (1983, Nature 303:179-180) bei 28 °C fur 24 h in 
10 Agrobacterien-Minimal Medium (AMM): 10 mM K 2 HP0 4 , 10 mM KH 2 P0 4 , 
10 mM Glucose, MM-Salze (2,5 mM NaCI, 2 mM MgS0 4 , 700 uM CaCI 2 , 9 
uM FeS0 4 , 4 mM (NH 4 ) 2 S0 4 ). 

Transformation von Agrobacterium tumefaciens 

15 Das Plasmid pBinAHyg wurde in den Agrobakterienstamm LBA 4404 
(Hoekema et al., 1983, Nature 303:179-180) elektroporiert (Mozo and 
Hooykaas, 1991, Plant Mol. Biol. 16:917-918). Zur Selektion wurden bei 
der Agrobakterienanzucht folgende Antibiotika verwendet: Rifampicin 50 
mg/l (Selektion auf das A. tumefaciens Chromosom), Streptomycin 30 mg/l 

20 (Selektion auf das Helferplasmid) und Kanamycin 100 mg/l (Selektion auf 
den binaren Vektor). 

Transformation von Blakeslea trispora 

Zur Transformation wurden die Agrobakterien nach 24 h Anzucht in AMM 
25 auf eine OD 6 oo von 0,15 in Induktionsmedium (IM: MM-Salze, 40 mM MES 
(pH 5,6), 5 mM Glucose, 2 mM Phosphat, 0,5% Glycerol, 200 uM 
Acetosyringone) verdunnt und emeut Ober Nacht in IM bis zu einer OD 6 oo 
von ca. 0,6 angezogen. 

30 Zur Co-lnkubation von Blakeslea ATCC 14271 bzw. ATCC14272 und 
Agrobacterium wurden 100 pi Agrobakteriensuspension mit 100 pi 
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Blakeslea Sporensuspension (10 7 Sporen/ml in 0,9% NaCI) gemischt und 
steril auf einer Nylon Membran (Hybond N, Amersham) auf IM-Agarose 
Platten (IM + 18 g/l Agar) verteilt. Nach 3 Tagen Inkubation bei 26 °C 
wurde die Membran auf eine MEP-Agarplatte (30 g/l Malzextrakt, 3 g/l 

5 Pepton, pH 5,5, 18 g/l Agar) uberfuhrt. Zur Selektion auf transformierte 
Blakesleazellen enthielt das Medium Hygromycin in einer Konzentration 
. von 100 mg/l sowie zur Selektion gegen Agrobakterien 100 mg/l 
Cefotaxim. Die Inkubation erfolgte fur ca. 7 Tage bei 26 °C. Anschliefcend 
erfolgte der Transfer von Mycel auf frische Selektionsplatten. Gebildete 

10 Sporen wurden mit 0,9% NaCI abgespiilt und auf CM17-1-Agar (3 g/l 
Glucose, 200 mg/l L-Asparagin, 50 mg/l MgS0 4 x 7H 2 0, 150 mg/l KH 2 P0 4 , 
25 ug/I ThiaminHCI, 100 mg/l Yeast Extract, 100 mg/l Na-desoxycholat, 
100 mg/L Hygromycin, 100 mg/L Cefotaxim, pH 5,5,18 g/l Agar) 
ausplattiert. Zur Isolierung einzelner gentechnisch veranderter Sporen 

15 wurden die Sporen durch ein FACS Gerat der Fa. BectonDickson (Modell 
Vantage+Diva Option) einzeln auf Selektivmedium abgelegt. 

Herstellung genetisch veranderter Blakeslea trispora durch 
Agrobacterium-vermittelte Transformation 
20 Herstellung des rekombinanten Plasmids pBinAHyg 

Aus dem Plasmid pANsCosI (Fig.1, Osiewacz, 1994, Curr. Genet. 26:87- 
90, SEQ ID NO: 4) wurde die gpdA-hph-trpC-Kassette als Bglll/Hindlll 
Fragment isoliert und in das mit BamHI/Hindlll geoffnete binare Plasmid 
pBin19 (Bevan, 1984, Nucleic Acids Res. 12:8711-8721) ligiert. Der so 

25 erhaltene Vektor wurde als pBinAHyg bezeichnet (Fig. 2, SEQ ID NO: 3) 
und enthielt das E. coli Hygromycin-Resistenzgen (hph) unter Kontrolle 
des gpd Promotors (SEQ ID NO: 1) und des trpC Terminators (SEQ ID 
NO: 2) aus Aspergillus nidulans sowie die entsprechenden 
Bordersequenzen, die fur den DNA-Transfer von Agrobacterium 

30 notwendig sind. Die in den weiter unten beschriebenen 
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AusfUhrungsbeispielen genannten Vektoren sind Abk6mmlinge von 
pBinAHyg. 

Obertragung von pBinAHyg und Abkommlingen von pBinAHyg in 
5 Agrobacterium tumefaciens 

Nachfolgend wird beispielhaft die Obertragung des Plasmids pBinAHyg in 
Agrobacterien beschrieben. Die Obertragung der Abkommlinge erfolgte 
analog. 

10 Das Plasmid pBinAHyg wurde in den Agrobakterienstamm LBA 4404 
(Hoekema et al., 1983, Nature 303:179-180) elektroporiert (Mozo and 
Hooykaas, 1991, Rant Mol. Biol. 16:917-918). Zur Selektion wurden bei 
der Agrobakterienanzucht folgende Antibiotika verwendet: Rifampicin 50 
mg/l (Selektion auf das A. tumefaciens Chromosom), Streptomycin 30 mg/l 

15 (Selektion auf das Helferplasmid) und Kanamycin 100 mg/l (Selektion auf 
den binaren Vektor). 

> 

Obertragung von pBinAHyg und Abkommlingen von pBinAHyg in 
Blakeslea trispora 

20 Zur Transformation wurden die Agrobakterien nach 24 h Anzucht in AMM 
auf eine OD 660 von 0,15 in Induktionsmedium (IM: MM-Salze, 40 mM MES 
(pH 5,6), 5 mM Glucose, 2 mM Phosphat, 0,5% Glycerol, 200 uM 
Acetosyringone) verdunnt und erneut uber Nacht in IM bis zu einer ODeeo 
von ca. 0,6 angezogen. 

25 

Zur Co-lnkubation von Blakeslea trispora (B.t.) und Agrobacterium 
tumefaciens (A.t.) wurden 100 pi Agrobakteriensuspension mit 100 pi 
Blakeslea Sporensuspension (10 7 Sporen/ml in 0,9% NaCI) gemischt und 
steril auf einer Nylon Membran (Hybond N, Amersham) auf IM-Agarose 
30 Platten (IM + 18 g/l Agar) verteilt. Nach 3 Tagen Inkubation bei 26 °C 
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wurde die Membran auf eine MEP-Agarplatte (30 g/l Malzextrakt, 3 g/l 
Pepton, pH 5,5, 18 g/l Agar) uberfuhrt. 

Zur Selektion auf transformierte Blakeslea-Zellen enthielt das Medium 
5 Hygromycin in einer Konzentration von 100 mg/l sowie zur Selektion 
gegen Agrobakterien 100 mg/l Cefotaxim. Die Inkubation erfolgte fQr ca. 7 
Tage bei 26 °C. AnschlieRend erfolgte der Transfer von Mycel auf frische 
Selektionsplatten. Gebildete Sporen wurden mit 0,9% NaCI abgespQIt und 
auf CM 17-1 -Agar (3 g/l Glucose, 200 mg/l L-Asparagin, 50 mg/l MgS0 4 x 
10 7H 2 O f 150 mg/l KH2P04, 25 pg/l Thiamin-HCI, 100 mg/l Yeast Extract, 
100 mg/l Na-desoxycholat, pH 5,5, 100 mg/l Cefotaxim, 100 mg/l 
Hygromycin, 18 g/l Agar) ausplattiert. Die Obertragung von Sporen auf 
frische Selektionsplatten wurde dreimal wiederholt. Auf diese Weise wurde 
die Transformante Blakeslea trispora GVO 3005 isoliert Altemativ erfolgte 
15 zur Selektion der GVO (gentechnisch veranderten Organismen) die 
Einzelablage der Sporen durch den BectonDickinson FacsVantage+Diva 
Option auf CM-17 Agar mit 100 mg/l Cefotaxim, 100 mg/l Hygromycin. In 
diesem Fall wurde nur dort Pilzmycel gebildet, wo die Sporen 
gentechnisch verandert waren. 

20 

Nachweis der genetischen Veranderung durch Obertragung von 
pBinAHyg und Abkommlingen von pBinAHyg in Blakeslea trispora 

Nachfolgend wird beispielhaft der Nachweis der Obertragung fur 
pBinAHyg in Blakeslea trispora beschrieben. Der Nachweis der 
25 Obertragung der Abkommlinge erfolgte analog. 

200 ml MEP-Medium (30 g/l Malzextrakt, 3 g/l Pepton, pH 5,5) wurden mit 
10 5 bis 10 7 Sporen der Transformante Blakeslea trispora GVO 3005 
beimpft und 7 Tage bei 26 °C mit 200 Upm auf einem Rundschuttler 
30 inkubiert. Zum Nachweis der erfolgreichen Transformation wurde DNA aus 
dem Mycel isoliert (Peqlab Fungal . DNA Mini Kit) und in einer PCR 
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(Programm: 94 °C 1 min, dann 30 Zyklen mit 1 min. 94°C, 1 min. 58 °C, 1 
min. 72 °C) eingesetzt. 

Zum Nachweis des Hygromycinresistenzgens (hph) wurden die Primer 
5 hph-forward (5-CGATGTAGGAGGGCGTGGATA, SEQ ID NO: 5) und 
hph-reverse (5-GCTTCTGCGGGCGATTTGTGT, SEQ ID NO: 6) 
verwendet. Das erwartete Fragment von hph wies eine Lange von 800 bp 
auf. 

10 Zur Amplffikation des Kanamycinresistenzgens nptlll und damit als 
Kontrolle auf Agrobakterien wurden die Primer nptlll-forward (5- 
TGAGAATATCACCGGAATTG, SEQ ID NO: 7) und nptlll-reverse (5'- 
AGCTCGACATACTGTTCTTCC, . SEQ ID NO: 8) verwendet. Das 
erwartete Fragment von nptlll wies eine Lange von 700 bp auf. 

15 

Zur Amplication eines Fragmentes des Glycerinaldehyd-3- 
phosphatdehydrogenasegens gpdl und damit als Kontrolle auf Blakeslea 
trispora wurden die Primer MAT292 (5- 

GTGAATGGAAATCCCATCGCTGTC, SEQ ID NO: 9) und MAT293 (5- 
20 AGTGGGTACTCTAAAGGCCATACC, SEQ ID NO: 10) verwendet. Das 
erwartete Fragment von gpdl wies eine Lange von 500 bp auf. 

Das Ergebnis der PCR der Blakeslea trispora DNA ist in Fig. 3 anhand 
eines Standard-Gels gezeigt. Die Spuren des Gels wurden 
25 folgendermaBen belegt: 

1) 100 bp Grolienmarker (100 bp - 1 kb) 

2) B.t. GVO 3005 primer nptlll-for / nptlll-rev 

3) B.t. GVO 3005 primer hph-for / hph-rev 

30 4) B.t. GVO 3005 primer MAT292 / MAT293 (gpd) 

5) A.t. mit Plasmid pBinAHyg primer nptlll-for / nptlll-rev 
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6) A.t. mit Plasmid pBinAHyg primer hph-for / hph-rev 

7) B.t. 14272 WT primer nptlll-for / nptlll-rev 

8) B.t 1 4272 WT primer hph-for / hph-rev 

9) B.t. 14272 WT primer MAT292 / MAT293 (gpd) 

5 

In der DNA von Blakeslea trispora wurde das Hygromycinresistenzgens 
(hph) und als Positivkontrolle Glycerinaldehyd-3- 
phosphatdehydrogenasegen (gpdl) nachgewiesen. nptlll konnte 
demgegeniiber nicht nachgewiesen werden. 

10 

Somit wurde die genetische Veranderung von Blakeslea trispora durch 
Agrobacterium-vermittelte Transformation nachgewiesen. 

Isoliemng homokaryotischer GVO von Blakeslea trispora: 

15 Durch erfolgreichen Transfer des Vectors pBinAHyg und Abkommlingen 
von pBinAHyg in Blakeslea trispora entstehen genetisch veranderte 
Organismen (GVO) von Blakeslea trispora. Jedoch liegen in Blakeslea in 
alien Stadien des vegetativen und des sexuellen Zellzyklus mehrkernige 
Zellen vor. Daher erfolgt die Insertion der Fremd-DNA in der Regel nur in 

20 einem Kern. Ziel ist es, Stamme von Blakeslea zu erhalten, bei denen die 
Insertion der Fremd-DNA in alien Kemen vorliegt, d.h. Ziel ist ein 
homonukleates rekombinantes Pilzmycel. 

1) Herstellung homonukleater rekombinanter Stamme durch FACS 
25 (fluorescence-activated cell sorting) 

Ein geringer Anteil der Sporen von Blakeslea trispora bzw. der 
gentechnisch veranderten Stamme von Blakeslea trispora ist von Natur 
aus einkemig. Zur Herstellung homonukleater rekombinanter Stamme, die 
Fremd-DNA von pBinAHyg oder pBinAHyg-AbkSmmlingen enthielten, 
30 wurden die einkemigen Sporen durch FACS aussortiert und auf MEP (30 
g/l Malzextrakt, 3 g/I Pepton, pH 5,5, 18 g/l Agar) mit 100 mg/l Cefotaxim 
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und 100 mg/l Hygromycin plattiert. Die hier gebildten Mycelien waren 
homonukleat. Zur Sortierung mit FACS wurden die Sporen eines 3 Tage 
alten Ausstriches mit 10 ml Tris-HCI 50mMol + 0,1% Span20 pro Agar- 
Platte abgeschwemmt. Die Sporenkonzentration betaig 0,5 bis 0,8 x 10 7 

5 Sporen pro ml. Zu 9 ml Sporensuspension wurden 1ml DMSO und 10 pt 
Syto 1 1 (Farbstoff-Stammlosung in DMSO Molecular Probes Nr.S-7573) 
zugegeben. Danach wurde 2 h bei 30°C gefarbt. Selektion und Ablage 
erfolgten mittels eines Gerates vom Typ FacsVantage+Diva Option Fa. 
Becton Dickinson. Die Selektion erfolgte zuerst nach GrSBe, urn einzelne 

10 Sporen von Aggregaten und Verunreinigungen zu trennen. Dann wurden 
diese Sporen nach ihrer Fluoreszenz (Anregung = 488nm; Emission = 
530 nm) sortiert abgelegt. Die linke Schulter der GauB-Kurve der 
Fluoreszenzhaufigkeitsverteilung enthielt die einkemigen Sporen. 

15 2) Herstellung homonukleater Stamme durch Kernreduktion und 
Selektion mit FACS 

Zur Reduzierung der Anzahl von Kemen pro Spore wurde vor der 
Selektion eine Behandlung von Sporensuspensionen mit MNNG (N- 
Methyl-N'-nitro-N-nitrosoguanidin) durchgefuhrt, und so durch chemische 
20 Mutagenese eine Kernreduktion erzielt 

Hierfur wurde zunachst eine Sporensuspension mit 1 x 10 7 Sporen/ml in 
Tris/HCI-Puffer, pH 7,0 hergestellt. Der Sporensuspension wurde MNNG 
in einer Endkonzentration von 100 \igfml zugegeben. Die Zeit der 
25 Inkubation in MNNG wurde so gewahlt, dass die Uberlebensrate der 
Sporen ca. 5% betrug, Nach Inkubation mit MNNG wurden die Sporen 
dreimal mit 1g/l Span 20 in 50 mM Phosphatpuffer pH 7,0 gewaschen und 
nach der unter 1) beschriebenen Methode sortiert bzw. selektiert. 
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Altemativ konnten zur Reduktion der Kernzahl in den Sporen auch 
Rontgen - und UV-Strahlen eingesetzt werden, wie es von Cerda-Olmedo 
und Patricia Reau in Mutation Res., 9 (1970), 369-384 beschrieben wurde. 

5 3) Herstellung homonukleater Stamme durch Selektion auf rezessive 
Selektionsmarker 

Als rezessiver Selektionsmarker zur Selektion homonukleater Mycelien 
kommt beispielsweise der rezessive Selektionsmarker pyrG in Frage. 
Wildtyp-Stamme von Blakeslea trispora sind pyrG + . Diese Stamme konnen 

10 nicht in Gegenwart des Pyrimidin-Analogs 5-Fluororotat (FOA) wachsen, 
weil sie FOA durch die Orotidin-5'-monophosphatdecarboxylase zu 
lethalen Metaboliten umsetzen. Gentechnisch veranderte Blakesleaa, die 
homonukleat pyrG" sind, fehlt die Enzymaktivitat Orotidin-5'- 
monophosphatdecarboxylase. Folglich konnen diese pyrG~-Stamme 5- 

15 Fluororotat nicht verwerten. Die Stamme wachsen daher in Gegenwart 
von FOA und Uracil. Im Fall der Kopplung der Mutation pyrG" und der 
insertion von Fremd-DNA auf dem Kern einer einkernigen Spore, kann 
aus dieser Spore homonukleates rekombinantes Pilzmycel gebildet 
werden. 

20 

Zunachst wurde durch Insertion eines Fragmentes von pyrG (SEQ ID NO: 
65) aus Blakeslea trispora in pBinAHyg das Plasmid pBinAHygBTpyrG- 
SCO (SEQ ID NO: 36, Fig. 4) erzeugt. Dieses Plasmid wurde in Blakelea 
trispora transformiert und fuhrte dort durch homologe Rekombination zur 
25 Disruption von pyrG. 

Homonukleate GVO von Blakeslea trispora mit dem Phanotyp pyrG" 
wurden foIgendermaBen selektiert. Zur Agrobakterium-vermittelten 
Transformation von pBinAHygBTpyrG-SCO wurde wie oben beschrieben 
30 auf MEP (30 g/l Malzextrakt, 3 g/l Pepton, pH 5,5, 18 g/l Agar) mit 100 
mg/l Cefotaxim und 100 mg/l Hygromycin plattiert Die Sporen der 
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Transformanten wurden mit 10 ml Tris-HCI 50mM + 0,1% Span20 pro 
Agar-Platte abgeschwemmt. Die Sporenkonzentration betrug 0,5 bis 0,8 x 
10 7 Sporen pro ml. Die Sporen wurden anschlieRend auf FOA-Medium mit 
100 mg/l Cefotaxim und 100 mg/l Hygromycin ausplattiert. FOA-Medium 

5 enthielt pro Liter 20 g Glucose, 1 g FOA, 50 mg Uracil, 200 ml Citrat-Puffer 
(0,5 M, pH 4,5) und 40 ml Spurensalzlosung nach Sutter, 1975, PNAS, 
72:127). Homonukleate pyrG"-Mutanten zeigten Wachstum auf dem 
Uracil-haltigen FOA-Medium; aber kein Wachstum bei Plattierung auf 
FOA-Medium ohne Uracil. Auf die gleiche Weise wurden aus den im 

10 folgenden beschriebenen GVO von Blakeslea trispora zur Herstellung von 
Xanthophyllen homonukleate GVO hergestellt. 

Altemativ ist es moglich die Sporen analog zur Vorschrift von Roncero et 
ai. auf Medium mit 5-Carbon-5-deazariboflavin zu plattieren, das 
15 zusatzlich Hygromycin enthalt (Roncero et al., 1984, Mutation Research, 
125: 195 - 204). Hierdurch werden homokaryonte Zellen des Genotyps 
hyg R und dar" selektiert. Nach diesem Prinzip werden homokaryonte 
Stamme von Blakeslea trispora mit dem Phanotyp hyg R und dar" erzeugt. 

20 

Ausfuhrungsbeispiele zur Herstellung von gentechnisch veranderten 
Organismen von Blakeslea trispora fur die Herstellung von 
Carotinoiden und Carotinoidvorstufen 

25 Die Erzeugung der im folgenden genannten Plasmide erfolgte durch die 
Methode ..overlap-extension PCR" und durch anschlieliende Insertion der 
Amplifikationsprodukte in das Plasmid pBinAHyg. Die Methode overlap- 
extension PCR" erfolgte wie in Innis et al. (Eds.) PCR protocols: a guide to 
methods and applications, Academic Press, San Diego beschrieben. Die 

30 Transformation der pBinAHyg-Abk6mmlinge und die Herstellung 



WO 2004/063358 



PCT/EP2004/000100 



44 

homonukleater gentechnisch veranderter Stamme von Blakeslea trispora 
erfolgte wie oben beschrieben. 

Gentechnisch veranderte Stamme von Blakeslea trispora zur 
5 Herstellung von Zeaxanthin 

Folgende Plasmide (Abkommlinge von pBinAHyg) wurden zur 
gentechnischen Veranderung von Blakeslea trispora fur die Herstellung 
von Zeaxanthin verwendet, codieren also u.a. Hydroxylasen (crtZ): 

p-tefl -HPcrtZ, enthaltend Gen der Hydroxylase HPcrtZ (SEQ ID 
10 NO: 70) aus Haematococcus pluvialis Flotow NIES-144 (Accession 

No. AF1 62276) unter Kontrolle des ptefl Promotors aus Blakeslea 
trispora (Seq. pBinAHygBTpTEFI -HPcrtZ, SEQ ID NO: 37, Fig. 5); 

p-carRA-HPcrtZ, enthaltend Gen der Hydroxylase HPcrtZ aus 
Haematococcus pluvialis Flotow NIES-144 unter Kontrolle des 
15 Promotors pcarRA aus Blakeslea trispora (Seq. pBinAHyg- 

BTpcarRA-HPcrtZ, SEQ ID NO: 38, Fig. 6) 

p-carB-HPcrtZ, enthaltend Gen der Hydroxylase HPcrtZ aus 
Haematococcus pluvialis Flotow NIES-144 unter Kontrolle des 
Promotors pcarB aus Blakeslea trispora (Seq. pBinAHygBTpcarB- 
20 HPcrtZ, SEQ ID NO: 39, Fig. 7) 

p-carRA-HPcrtZ-TAG-3'carA-IR, enthaltend Gen der Hydroxylase 
HPcrtZ aus Haematococcus pluvialis Flotow NIES-144 unter 
Kontrolle des Promotors pcarRA aus Blakeslea trispora. 
Stromabwarts des Gens der Hydroxylase 1st eine Inverted-Repeat- 
25 Struktur lokalisiert, die aus dem 3-Ende von carA und der 

stromabwarts von carA gelegenen Region stammt (IR, SEQ ID NO: 
74, .Inverted Repeat 1' ca. 350 bp von carA, dann ca. 200 bp .Loop' 
und anschlieliend ca. 350 bp .Inverted Repeat 2 1 ) (Seq. pBinAHyg- 
BTpcarRA-HPcrtZ-TAG-3'carA-l R, SEQ ID NO: 40, Fig. 8); 



WO 2004/063358 



PCT/EP2004/000100 



45 



p-carRA-HPcrtZ-GCG-3'carA-IR, enthaltend Gen der Hydroxylase 
HPcrtZ aus Haematococcus pluvialis Flotow NIES-144 unter 
Kontrolle des Promotors pcarRA aus Blakeslea trispora. Das Gen 
der Hydroxylase ist mit einer Inverted-Repeat-Struktur fusioniert, 

5 die aus dem 3'-Ende von carA und der stromabwarts von carA 

gelegenen Region stammt (IR, SEQ ID NO: 74, .Inverted Repeat V 
ca. 350 bp von carA, dann ca. 200 bp .Loop' und anschlieBend ca. 
350 bp .Inverted Repeat 2'). Das abgeleitete Fusionsprotein besteht 
folglich aus der Hydroxylase von Haematococcus pluvialis und dem 

10 Carboxyterminus von CarA aus Blakeslea trispora (Seq. pBinAHyg- 

BTpcarRA-HPcrtZ-GCG-3'carA-IR, SEQ ID NO: 41, Fig. 9); 

p-tefl-EUcrtZ, enthaltend Gen der Hydroxylase EUcrtZ (SEQ ID 
NO: 71) aus Erwinia uredova 20D3 (Accession No. D90087) unter 
Kontrolle des ptefl Promotors (Seq. pBinAHygBTpTEFI -EUcrtZ, 
15 SEQ ID NO: 42, Fig. 10); 

p-carRA-EUcrtZ, enthaltend Gen der Hydroxylase EUcrtZ aus 
Erwinia uredova 20D3 unter Kontrolle des Promotors pcarRA aus 
Blakeslea trispora (Seq. pBinAHygBTpcarRA-EUcrtZ, SEQ ID NO: 

43, Fig. 11); 

20 .- p-carB-EUcrtZ, enthaltend Gen der Hydroxylase EUcrtZ aus 
Erwinia uredova 20D3 unter Kontrolle des Promotors pcarB aus 
Blakeslea trispora (Seq. pBinAHygBTpcarB-EUcrtZ, SEQ ID NO: 

44, Fig. 12); 

p-gpdA-HPcrtZ-t-crtZ, enthaltend Gen der Hydroxylase HPcrtZ aus 
25 Haematococcus pluvialis Flotow NIES-144 unter Kontrolle des 

gpdA Promotors und des Terminators t-crtZ; d.h. des stromabwarts 
von crtZ aus Haematococcus pluvialis Flotow NIES-144 gelegenen 
Sequenzabschnitts (SEQ ID NO: 73) (Seq. pBinAHyg-gpdA-HPcrtZ- 
tcrtZ, SEQ ID NO: 45, Fig. 13). 
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p-gpdA-BTcarR-HPcrtZ-BTcarA, enthaltend Genfusion aus Genen 
der Lycopincyclase carR aus Blakeslea trispora, der Hydroxylase 
HPcrtZ aus Haematococcus pluvialis Flotow NIES-144 und der 
Phytoensynthase carA aus Blakeslea trispora unter Kontrolle des 
5 gpdA Promotors aus Aspergillus nidulans (Seq. pBinAHyg- 

carR_crtZcarA, SEQ ID NO: 46, Fig. 14); 



Herstellung gentechnisch veranderter Stamme von Blakeslea 
trispora zur Herstellung von Canthaxanthin 

10 Folgende Plasmide (Abkommlinge von pBinAHyg) wurden zur 
gentechnischen Veranderung von Blakeslea trispora fur die Herstellung 
von Canthaxanthin verwendet, codieren also u.a. Ketolasen (crtW): 

p-tefl-NPcrtW, enthaltend das Gen der Ketolase NPcrtW (SEQ ID 
NO: 72) aus Nostoc punctiforme PCC73102 (ORF148, Accesion 
15 No. NZ_AABC01000196) unter Kontrolle des ptefl Promotors aus 

Blakeslea trispora (Seq. pBinAHygBTpTEFI-NpucrtW, SEQ ID NO: 
47, Fig. 15); 

p-carRA-NPcrtW, enthaltend das Gen der Ketolase NPcrtW aus 
Nostoc punctiforme PCC73102 unter der Kontrolle des Promotors 
20 pcarRA aus Blakeslea trispora (Seq. pBinAHygBTpcarRA-NpucrtW, 

SEQ ID NO: 48, Fig. 16); 

p-carB-NPcrtW, enthaltend das Gen der Ketolase NPcrtW aus 
Nostoc punctiforme PCC73102 unter der Kontrolle des Promotors 
pcarB aus Blakeslea trispora (Seq, pBinAHygBTpcarB-NpucrtW, 
25 SEQ ID NO: 49, Fig. 17); 



Herstellung gentechnisch veranderter Stamme von Blakeslea 
trispora zur Herstellung von Astaxanthin 

Folgende Plasmide (Abkommlinge von pBinAHyg) wurden zur 
30 gentechnischen Veranderung von Blakeslea trispora fur die Herstellung 
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von Astaxanthin verwendet, codieren also u.a. fOr Hydroxylasen (crtZ) und 

Ketolasen (crtW): 

p-carRA-HPcrtZ-pcarRA-NPcrtW, enthaltend das Gen der 
Hydroxylase HPcrtZ aus Haematococcus pluvialis Flotow NIES-144 
5 und das Gen der Ketolase NPcrtW aus Nostoc punctiforme 

PCC73102 (ORF148, Accesion No. NZ_AABC01000196) beide 
jeweils unter Kontrolle des Promotors pcarRA aus Blakeslea 
trispora (Seq. pBlnAHygBTpcarRA-HPcrtZ-BTpcarRA-NpucrtW, 
SEQID NO: 50, Fig. 18); 

10 - p-carRA-EUcrtZ-pcarRA-NPcrtW, enthaltend das Gen der 
Hydroxylase EUcrtZ aus Erwinia uredova20D3 (Accession No. 
D90087) und das Gen der Ketolase NPcrtW aus Nostoc 
punctiforme PCC73102 beide jeweils unter Kontrolle des Promotors 
pcarRA aus Blakeslea trispora (Seq. pBinAHygBTpcarRA-EUcrtZ- 

15 BTpcarRA-NpucrtW, SEQ ID NO: 51 , Fig. 19); 



Klonierung und Sequenzanalyse von Genen und Promotoren, die 
beispielhaft fur die gentechnische Veranderung von Blakeslea 
trispora genutzt werden konnen. 

20 Nachfolgend werden beispielhaft die Klonierung und Sequenzierung 

verschiedener Gene und Promotoren aus Blakeslea trispora beschrieben. 

Klonierung und Sequenzanalyse ptef 1 

Die Klonierung von p-tef aus Blakeslea trispora erfolgte auf der Grundlage 
25 einer bereits in GenBank ver6ffentlichten Sequenz des Strukturgens fQr 
den Translations-Elongationsfaktor 1-a aus Blakeslea trispora 
(AF1 57235). Ausgehend von dem Sequenzeintrag AF1 57235 wurden 
Primer fQr die inverse PCR ausgewahlt, urn die stromaufwarts des 
Strukturgens gelegene Promotoregion zu amplifizieren und zu 
30 sequenzieren. 
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In der inversen nested PCR an 200 ng Xhol-gespaltener und 
zirkularisierter genomischer DNA von Blakeslea trispora ATCC 14272 
wurde ein 3000-bp-Fragment in folgendem Ansatz erhalten: Matrizen-DNA 
(1 pg genomische DNA von Blakeslea trispora ATCC 14272) Primer 

5 MAT344 5'-GGCGTACTTGAAGGAACCCTTACCG-3' (SEQ ID NO: 63) 
und MAT 345 S'-ATTGATGCTCCCGGTCACCGTGATT-S* (SEQ ID NO: 
64) je 0,25 pM, 100 pM dNTP, 10 pi Herculase-Polymerasepuffer 10x, 5 U 
Herculase (Zugabe bei 85 °C), H 2 0 ad 100 pi. Das PCR-Profil war 95 °C, 
10 mln (1 Zyklus); 85 °C, 5 min (1 Zyklus); 60 °C, 30 s. 72 °C, 60 s, 95 °C, 

10 30 s (30 Zyklen); 72 °C, 10 min (1 Zyklus). Der Sequenzabschnitt, der 
stromaufwarts des vemiutlichen Startcodons des Gens tefl innerhalb 
3000-bp-Fragmentes liegt, wurde als Promotor ptefl bezeichnet. 

Klonierung Sequenzanalyse des Gens der HMG-CoA-Reduktase aus 
15 Blakeslea trispora 

Zunachst wurde mit dem Cosmidvektor pANsCosI eine Genbank von 
Blakeslea trispora ATCC 14272, Mating Type (-) hergestellt. Der Vektor 
wurde durch Spaltung mit Xbal linearisiert und anschliedend 
dephosphoryliert. Eine weitere Spaltung mit mit BamHI schuf die 
20 Insertionsstelle, in welche die mit Sau3AI partiell gespaltene und 
dephosphorylierte genomische DNA von Blakeslea trispora ligiert wurde. 
Die derart gebildeten Cosmide wurden anschlieliend in vitro verpackt und 
in Escherichia coli Qbertragen. 

Auf der Grundlage der bekannten Sequenz eines Fragmentes des HMG- 
25 CoA-Reduktase codierenden Gens aus Blakeslea trispora (Eur. J. 
Biochem 220, 403-408 (1994)) wurde eine 315-bp-DNA-Sonde durch 
folgende PCR hergestellt. Reaktionsansatz: 1 pg genomische DNA von 
Blakeslea trispora ATCC 14272, Primer MAT314 5'- 
CCGATGGCGACGACGGAAGGTTGTT-3' [SEQ ID NO 79] und MAT315 
30 5'-CATGTTCATGCCCATTGCATCACCT-3' [SEQ ID NO 80] je 0,25 pM, 
100 pM dNTP, 10 pi Herculase-Polymerasepuffer 10x, 5 U Herculase 
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(Zugabe bei 85 °C), H 2 0 ad 100 pi. Das PCR-Profil war 95 °C, 10 min (1 
Zyklus); 85 °C, 5 min (1 Zyklus); 58 °C, 30 s. 72 °C, 30 s, 95 °C, 30 s (30 
Zyklen); 72 °C, 10 min (1 Zyklus). 

Mit dieser DNA-Sonde wurde die Cosmid-Genbank durchmustert. Es 
5 wurde ein Klon identitlziert, dessen Cosmid mit der DNA-Sonde 
hybridisierte. Die Insertion dieses Cosmids wurde sequenziert. Die DNA- 
Sequenz enthielt einen Abschnitt, der dem Gen einer HMG-CoA- 
Reduktase zugeordnet wurde [SEQ ID NO 75]. 

10 Klonierung und Sequenzanalyse carB 

(carB = Gen der Phytoendesaturase aus Blakeslea trispora) 
Aus dem Sequenzvergleich der Peptidsequenzen von 
Phytoendesaturasen und dem Vergleich der zugehdrigen DNA- 
Sequenzen von Phycomyces blakesleeanus, Cercospora nicotianae, 

15 Phaffia rhodozyma und Neurospora crassa wurden die degenerierten 
Primer MAT182 5'-GCNGARGGNATHTGGTA-3' (SEQ ID 52) und 
MAT192 5'-TCNGCNAGRAADATRTTRTG-3' (SEQ ID 53) abgeleitet. Die 
PCR wurde in 100 pi Ansatzen durchgefuhrt. Diese enthielten 200 ng 
genomische DNA von Blakeslea trispora ATCC14272, 1 pM MAT182, 1 

20 pM MAT192, 100 pM dNTP, 10 pi Pfu-Polymerasepuffer 10x, 2,5 U Pfu- 
Polymerase (Zugabe bei 85 °C), H 2 0 ad 100 pi. 

Das PCR-Profil war 95 °C, 10 min (1 Zyklus); 85 °C, 5 min (1 Zyklus); 40 
°C, 30 s, 72 °C, 30 s, 95 °C, 30 s (35 Zyklen); 72 °C, 10 min (1 Zyklus). 

25 

Hiermit wurde ein 358-bp-Fragment erhalten, dessen abgeleitete 
Peptidsequenz Ahnlichkeit zu den Sequenzen der Phytoendesaturasen 
aufwies. Durch die Methode der inversen PCR (Innis et al. in PCR 
protocols: a guide to methods and applications. 1990. S. 219-227) wurden 
30 nach dem Prinzip des Chromosome-Walking die Genregionen 



WO 2004/063358 



PCT/EP2004/000100 



50 

stromaufwarts und stromabwarts des 350-bp-Fragmentes folgendermaSen 
amplifiziert, kloniert und sequenziert: 

(i) ein 1,1-kbp-Fragment durch PCR mit den Primern MAT219 5'- 
AAGTGACACCGGTTACACGCTTGTCTT-3' (SEQ ID 54) und MAT 

5 220 S'-GCTTATCACCATCTGTTACCTCCTTGC-S' (SEQ ID 55) 

erhalten aus 200 ng EcoRI-gespaltener und zirkularisierter 
genomischer DNA von Blakeslea trispora ATCC14272, 0,25 pM 
MAT219, 0,25 [iM MAT220, 100 pM dNTP, 10 pi Herculase- 
Polymerasepuffer 10x, 5 U Herculase (Zugabe bei 85 °C), H 2 0 ad 

10 100 pi. Das PCR-Profll war 95 °C, 10 min (1 Zyklus); 85 °C, 5 min 

(1 Zyklus); 60 °C, 30 s. 72 °C, 60 s, 95 °C, 30 s (30 Zyklen); 72 °C, 
10 min (1 Zyklus), 

(ii) ein 2,9-kbp-Fragment durch PCR mit den Primern MAT219 und 
MAT220 erhalten aus 200 ng Xbal-gespaltener und zirkularisierter 

15 genomischer DNA von Blakeslea trispora ATCC14272, 0,25 pM 

MAT219, 0,25 uM MAT220, 100 pM dNTP, 10 ul Herculase- 
Polymerasepuffer 10x, 5 U Herculase (Zugabe bei 85 °C), H 2 0 ad 
100 pi. Das PCR-Profil war 95 °C, 10 min (1 Zyklus); 85 °C, 5 min 
(1 Zyklus); 60 °C, 30 s, 72 °C, 3 min, 95 °C, 30 s (30 Zyklen); 72 °C, 
20 10 min (1 Zyklus); 

Der klonierte Sequenzabschnitt ist schematisch in Fig. 20 [SEQ ID NO 77] 
dargestellt. Die Sequenzierung erfolgte in Strang- und 
Gegenstrangrichtung mit den klonierten Fragmenten sowie mit den PCR- 
Produkten. Die Sequenz des klonierten Sequenzabschnitts ist in Fig. 21 
25 [SEQ ID NO 78] gezeigt. 

Sequenzvergleiche 

Die Nukleotidsequenz von carB und die Peptidsequenz des abgeleiteten 
Proteins CarB wurden mit den bekannten Sequenzen verwandter Proteine 
30 verglichen. Zum Sequenzvergleich wurden die Programme GAP und 
BESTFIT eingesetzt. 
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CarB - Identische Aminoacylreste nach GAP 

Programmeinstellungen: 
Gap Weight: 8 
5 Length Weight: 2 
Average Match: 2.912 
Average Mismatch: -2.003 

Dabei wurde folgende Werte fur die Obereinstimmung der Aminosauren zu 
CarB aus Blakeslea trispora ATCC14272 in % gefunden: 
10 Phycomyces blakesleeanus: 72,491 
Phaffia rhodozyma: 50,460 
Neurospora crassa: 47,943 
Cercospora nicotianae: 47,740 

15 

CarB -Identische Aminoacylreste nach BESTFIT 

Programmeinstellungen: 
Gap Weight: 8 
Length Weight: 2 
20 Average Match: 2.912 
Average Mismatch: -2.003 

Dabei wurde folgende Werte fur die Obereinstimmung der Aminosauren zu 
CarB aus Blakeslea trispora ATCC14272 in % gefunden: 
Phycomyces blakesleeanus: 73,380 
25 Phaffia rhodozyma: 53, 1 75 

Neurospora crassa: 51,896 
Cercospora nicotianae: 50,791 

carB - Identische Basen nach GAP 

30 Programmeinstellungen: 
Gap Weight: 50 
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Length Weight: 3 
Average Match: 10.000 
Average Mismatch: 0.000 

Dabei wurde folgende Werte fur die Obereinstimmung der Basen zu CarB 
5 aus Blakeslea trispora ATCC14272 in % gefunden: 
Phycomyces blakesleeanus: 64,853 
Cercospora nicotianae: 50,143 
Phaffia rhodozyma: 43,179 
Neurospora crassa: 42,130 

10 

carB -Identische Basen nach BESTFIT 

Programmeinstellungen: 
Gap Weight: 50 
Length Weight: 3 
15 Average Match: 10.000 
Average Mismatch: -9.000 

Dabei wurde folgende Werte fur die Obereinstimmung der Basen zu CarB 
aus Blakeslea trispora ATCC14272 in % gefunden: 
Phycomyces blakesleeanus: 68,926 
20 Phaffia rhodozyma: 62,403 
Neurospora crassa: 60,230 
Cercospora nicotianae: 56,884 

Klonierung zur Expression von carB 

25 Zur Klonierung und Expression von carB aus Blakeslea trispora wurden 
von dem oben beschriebenen klonierten Sequenzabschnitt aus Blakeslea 
trispora in sechs Leserastem die mSglichen Proteinsequenzen abgeleitet. 
Diese Proteinsequenzen wurden mit den Sequenzen der 
Phytoendesaturasen aus Phycomyces blakesleeanus, Phaffia rhodozyma, 

30 Neurospora crassa, Cercospora nicotianae verglichen. Auf der Grundlage 
des Sequenzvergleiches wurden im klonierten Sequenzabschnitt der 
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genomischen DNA von Blakeslea trispora drei Exons identifiziert, die 
zusammengefugt eine codierende Region ergeben, deren abgeleitetes 
Genprodukt Gber die gesamte Lange 72,7% identische Aminoacylreste mit 
der Phytoendesaturase CarB aus Phycomyces blakesieeanus aufweist. 

5 Dieser Sequenzabschnitt aus drei moglichen Exons und zwei moglichen 
Introns wurde daher als Gen carB bezeichnet Zur Oberpriifung der 
vorhergesagten Genstruktur wurde die codierende Sequenz von carB aus 
Blakeslea trispora durch PCR mit cDNA von Blakeslea trispora als Matrize 
und mit den Primern Boll 425 5- 

10 AGAGAGGGATCCTTAAATGCGAATATCGTTGC-3' (SEQ ID 56) und 
BOI1426 S'-AGAGAGGGATCCATGTCTGATCAAAAGAAGCA-S* (SEQ ID 
57) erzeugt. Das erhaltene DNA-Fragment wurde sequenziert. Die 
Lokalisation von Exons und Introns wurde durch Vergleich der cDNA mit 
der genomischen DNA von carB bestatigt. In Fig. 21 ist die codierende 

15 Sequenz von carB schematisch dargestellt. Zur Expression von carB in 
Escherichia coli wurde zunachst die Ndel-Schnittstelle in carB durch die 
Methode overlap extension PCR entfernt sowie am 5-Ende des Gens eine 
Ndel-Schnittstelle und am 3'-Ende eine BamHI-Schnittstelle eingefugt. 
Das erhaltene DNA-Fragment wurde mit dem Vektor pJOE2702 ligiert. 

20 Das erhaltene Plasmid wurde als pBT4 bezeichnet und zusammen mit 
pCAR-AE in Escherichia coli XL1-Blue kloniert. Die Expression erfolgte 
durch Induktion mit Rhamnose. Der Nachweis der Enzymaktivitat erfolgte 
durch Nachweis der Lycopinsynthese via HPLC. Die Klonierungsschritte 
sind im folgenden beschrieben: 

25 PCR 1.1: 

Ca. 0,5 M9 cDNA von Blakeslea trispora, 0,25 \iM MAT350 5- 
ACT7TATTGGATCCTTAAATGCGAATATCGTTGCTGC-3 , (SEQ ID 58), 
0,25 pM MAT244 5'- 

GTTCCAATTGGCCACATGAAGAGTAAGACAGGAAACAG-3' (SEQ ID 
30 59), 100 pM dNTP, 10 pi Pfu-Polymerase-Puffer (lOx), 2,5 U Pfu- 
Polymerase (Zugabe bei 85 °C, "hot start") und H 2 Q ad 100pL. 
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Temperaturprofil: 

1. 95 °C 10 min, 2. 85 °C 5 min, 3. 40 °C 30s, 4. 72 °C 1 min 30 s, 5. 95 
°C 30 s, 6. 50 °C 30 s, 7. 72 °C 1 min 30 s, 8. 95 °C 30 s, 9. 72 °C 10min 
Zykien: (1-2.) 1x, (3-5.) 5x, (6-8.) 25x, (9.) 1x 

5 

PCR1.2: 

Ca. 0,5 ug cDNA von Blakeslea trispora, 0,25 uM MAT243 5'- 
CCTGTCTTACTCTTCATGTGGCCAATTGGAACCAACAC-3' (SEQ ID 

60) , 0,25 uM MAT353 5'- 
10 CTATTTTAATCATATGTCTGATCAAAAGAAGCATATTG-3' (SEQ ID 61), 

100 mM dNTP, 10 ul Pfu-Polymerase-Puffer (lOx), 2,5 U Pfu-Polymerase 

(Zugabe bel 85 °C, "hot start") und H z O ad 100 uL. 

Temperaturprofil: 

1. 95 °C 10 min, 2. 85 °C 5 min, 3. 40 °C 30s, 4. 72 °C 1 min 30 s, 5. 95 
15 °C 30 s, 6. 50 °C 30 s, 7. 72 °C 1 min 30 s, 8. 95 °C 30s, 9. 72 °C 10min 
Zykien: (1 -2.) 1x, (3-5.) 5x, (6-8.) 25x, (9.) 1x 

Reinigung der PCR-Fragmente aus PCR 1.1, 1.2 

Dazu wurde PCR 2 zur Herstellung der codierenden Sequenz von carB 
20 aus Blakeslea trispora fur die Klonierung in pJOE2702 durchgefuhrt: 

Ca. 50 ng Produkt aus PCR 1.1 und ca. 50 ng Produkt aus PCR1.2 mit 

0. 25 uM MAT350 (5'- 
ACTTTATTGGATCCTTAAATGCGAATATCGTTGCTGC-3' SEQ ID NO 
58), 0,25 uM MAT353 (5'- 

25 CTATTTTAATCATATGTCTGATCAAAAGAAGCATATTG-3 , SEQ ID NO 

61) , 100 uM dNTP, 10 uL Pfu-Polymerase-Puffer (lOx), 2,5 U Pfu- 
Polymerase (Zugabe bei 85 °C, "hot start") und H 2 0 ad 100 uL. 
Temperaturprofil: 

1. 95°C 10 min, 2. 85 °C 5 min, 3. 59 °C 30 s, 4. 72 °C 2 min, 5. 95 °C 30 
30 s, 6.72°C 10 min 

Zykien: (1-2.) 1x, (3-5.) 22x, (6.) 1x 
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Anschlieftend erfolgte eine Reinigung des erhaltenen Fragmentes (~ 1,7 
kbp), eine Ligation in Vektor pPCR-Script-Amp, eine Klonierung in 
Escherichia coli XL1-Blue, Sequenzierung der Insertion, Spaltung mit Ndel 
und BamHI sowie eine Ligation in pJOE2702. Das erhaltene Plasmid 
5 wurde als pBT4 bezeichnet. 



Charakterisierung und Nachweis der Enzymaktivitat von CarB 
(Phytoendesaturase) 

Das von carB abgeleitete Genprodukt wurde als CarB bezeichnet. CarB 
10 weist auf Grundlage der Peptidsequenzanalyse folgende Eigenschaften 
auf: 

Lange: 582 Aminoacylreste 

Molekulare Masse: 66470 
Isoelektrische Punkt: 6,7 
15 Katalytische Aktivitat: Phytoendesaturase 

Edukt: Phytoen 
Produkt: Lycopin 
EC-Nummer: EC 1.14.99- 

Der Nachweis der Enzymaktivitat erfolgte in vivo. Wenn das Plasmid 
20 (pCAR-AE) in Escherichia coli XL1-Blue ubertragen wird, entsteht der 
Stamm Escherichia coli XL1-Blue (pCAR-AE). Dieser Stamm synthetisiert 
Phytoen. Wenn zusatzlich das Plasmid pBT4 in Escherichia coli XL1-Blue 
ubertragen wird, entsteht der Stamm Escherichia coli XL1-Blue (pCAR- 
AE)(pBT4). Da ausgehend von carB eine enzymatisch aktive 
25 Phytoendesaturase gebildet wird, produziert dieser Stamm Lycopin. 



Die Plasmide pCAR-AE und pBT4 wurden daher in Escherichia coli 
ubertragen. Nach Wachstum in Flussigkultur wurden die Carotinoide aus 
den Zellen extrahiert und charakterisiert (vgl. oben). 
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Durch HPLC Analyse wurde nachgewiesen, dafi der Stamm Escherichia 
coli XL1-Blue (pCAR-AE) Phytoen und der Stamm Escherichia coli XL1- 
Blue (pCAR-AE)(pBT4) Lycopin produziert. CarB weist folglich die 
Enzymaktivitat einer Phytoendesaturase auf. 

5 

Herstellung gentechnisch veranderter Stamme von Blakeslea 
trispora zur Herstellung von Phytoen 

Nachfolgend werden beispielhaft die Herstellung von gentechnisch 
veranderten Organismen zur Herstellung von Phytoen beschrieben. 

10 

Vector pBinAHygAcarB zur Erzeugung von carB- -Mutanten von 
Blakeslea trispora 

FQr die Deletion von carB in Blakeslea trispora wurde der Vektor 
pBinAHygAcarB (SEQ. ID. NO:62, Fig. 22) konstruiert. Der Vorlaufer von 
15 pBinAHygAcarB ist pBinAHyg (SEQ. ID. NO:3, Fig. 2). pBinAHyg wurde 
folgendermaften konstruiert: 

Aus dem Plasmid pANsCosl (SEQ. ID. NO:4, Fig. 1, Osiewacz, 1994, 
Curr. Genet. 26:87-90) wurde die gpdA-hph Kassette als Bglll/Hindlll 
Fragment isoliert und in das BamHI/Hindlll geoffnete binare Plasmid 

20 pBin19 (Bevan, 1984, Nucleic Acids Res. 12:8711-8721) ligiert. Der so 
erhaltene Vektor wurde als pBinAHyg bezeichnet und enthalt das E. coli 
Hygromycin-Resistenzgen (hph) unter Kontrolle des gpd Promotors und 
des trpC Terrminators aus Aspergillus nidulans sowie die entsprechenden 
Bordersequenzen, die fur den DNA-Transfer von Agrobacterium 

25 notwendig sind. 

Die Amplifikation der codierenden Sequenz von carB mit den Primem 
MAT350 und MAT353 mittels PCR wurde mit den folgenden Parametern 
durchgefuhrt: 

30 50 ng pBT4 mit 0,25 pM MAT350 (S'-ACTTTATTGGATCCTTAAAT- 
GCGAATATCGTTGCTGC-3 1 ; SEQ ID NO 58), 0,25 pM MAT353 (5 f - 
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CTATTTTAATCATATGTCTGATCAAAAGAAGCATATTG-3'; SEQ ID NO 
61), 100 pM dNTP, 10 pL Pfu-Polymerase-Puffer, 2,5 U Pfu-Polymerase 
(Zugabe bei 85 °C, "hot start") und ad 100 \iL H 2 0 
Temperaturprofil: 

5 1. 95 °C 10 min, 2. 85 °C 5 min, 3. 58 °C 30s, 4. 72°C 2 min, 5. 95 °C 30s, 
6. 72 °C 10 min. 

Zyklen: (1.-2.) 1x, (3-5.) 30x, (6.) 1x 

AnschlieRend erfolgte eine Reinigung des emaltenen Fragmentes (~ 1,7 
10 kbp), eine Spaltung mit Hindlll, eine weitere Reinigung des 364-bp-Hindlll- 
Fragments-carB, gefolgt von einer Spaltung von pBinAHyg mit Hindlll, eine 
Ligation von 364-bp-Hindlll-Fragments-carB in pBinAHyg, eine 
Transformation des Vektors in Escherichia coli und eine Isolierung des 
Konstruktes und Bezeichnung als pBinAHygAcarB wie oben beschrieben. 
15 Alternativ erfolgte eine partielle Spaltung mit Hindlll und die Klonierung 
eines grolieren Hindill-Fragmentes aus carB in pBinAHyg zur Herstellung 
von pBinAHygAcarB. 

Erzeugung von carB' -Mutanten von Blakeslea trispora 

20 Zunachst wurde das Plasmid pBinAHygAcarB in den Agrobakterienstamm 
LBA 4404 ubertragen, z. B. durch Elektroporation (vgl. oben). 
Anschlie&end wurde das Plasmid von Agrobacterium tumefaciens LBA 
4404 in Blakeslea trispora ATCC 14272 und in Blakeslea trispora ATCC 
14271 Ubertragen (vgl. oben). Der erfolgrelche Nachweis des 

25 Gentransfers in Blakesleslea trispora erfolgte uber Polymerase- 
Kettenreaktion nach folgendem Protokoll: 

Ca. 0,5 ug DNA aus Blakeslea trispora ATCC 14272 carB- bzw. ATCC 
14271 carB" wurden mit 0,25 uM Primer hph forward (5'- 
CGATGTAGGAGGGCGTGGATA-3'; SEQ ID NO 5), 0,25 uM Primer hph 
30 reverse (S'-GCTTCTGCGGGCGATTTGTGT-S'; SEQ ID NO 6), 100 uM 
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dNTP, 10 pL Herculase-Polymerase-Puffer, 2,5 U Herculase-DNA- 
Polymerase (Zugabe bei 85 °C, "hot start") und ad 100 pi H 2 0 umgesetzt. 
Temperaturprofil: 

1. 95°C 10 min, 2. 85 °C 5 min, 3. 58 °C 1 min, 4. 72 °C 1 min, 5. 94 °C 1 
5 min, 6.72°C 10 min. 

Zyklen: (1.-2.) 1x, (3-5.) 30x, (6.) 1x 

Als Negativkontrolle wurde eine Amplifikation des 
Kanamycinresistenzgens aus Agrobacterium versucht. Dazu wurden 

10 folgende PCR-Bedingungen verwendet: 

Ca. 0,5 pg DNA aus Blakesiea trispora ATCC 14272 carB- bzw. ATCC 
14271 carB - wurden mit 0,25 pM Primer nptlll forward (5- 
TGAGAATATCACCGGAATTG-3'; SEQ ID NO 7), 0,25 pM Primer nptlll 
reverse (AGCTCG ACATACTGTTCTTCC-3' ; SEQ ID NO 8), 100 pM 

15 dNTP, 10 pL Herculase-Polymerase-Puffer, 2,5 U Herculase-DNA- 
Polymerase (Zugabe bei 85 °C, "hot start") und ad 100 pL H 2 0 umgesetzt. 
Temperaturprofil: 

1. 95 °C 10 min, 2. 85 °C 5 min, 3. 58 °C 1 min, 4. 72 °C 1 min, 5. 94 °C 1 
min, 6. 72 °C 10 min- 
" 20 Zyklen: (1-2.) 1x, (3-5.) 30x, (6.) 1x 



Produktion von Carotinoiden und Carotinoidvorstufen mit Blakesiea 
trispora 

25 Zur Produktion der Garotinoide Zeaxanthin, Canthaxanthin, Astaxanthin 
und Phytoen wurden die entsprechenden gentechnisch veranderten 
Blakesiea trispora (+) und (-) Stamme fermentiert, das produzierte 
Carotinoid mittels HPLC Analyse nachgewiesen und isoliert. 
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Das Flussigmedium zur Produktion von Carotinoiden enthielt pro Liter 19 
g Maismehl, 44 g Sojamehi, 0,55 g KH 2 P0 4 , 0,002 g Thiaminhydochlorid, 
10 % Sonnenblumenol. Der pH wurde mit KOH auf 7,5 eingestellt. 

5 Zur Herstellung der Carotinoiden wurden Schuttelkolben mit 
Sporensuspensionen von (+) und (-) Stammen der GVO von Blakeslea 
trispora beimpft Die Schuttelkolben wurden bei 26 °C mit 250 rpm fur 7 
Tage inkubiert Altemativ wurde zu Mischungen der Stamme nach 4 
Tagen Trisporsauren zugegeben und weitere 3 Tage inkubiert. Die 

10 Endkonzentration der Trisporsauren betrug 300 - 400 pg/ml. 

Extraktion und Analytik 
Extra ktion: 

1 . Entnahme von 10 ml Kultursuspension 
15 2. Zentrifugation, 10 min, 5.000 x g 

3. Verwerfen des Oberstandes 

4. Resuspendierung des Pellets in 1 ml Tetrahydrofuran (THF) durch 
Vortexen 

5. Zentrifugation, 5 min, 5.000 x g 
20 6. Abnahme der THF-Phase 

7. Wiederholung der Schritte 4.-6. (2 x) 

8. Vereinigung der THF-Phasen 

9. Zentrifugation der vereinigten THF-Phasen 5 min bei 20.000 x g, 
um Reste der wafirigen Phase abzutrennen 

25 

Analytik 

Messung von Phytoen mittels HPLC 

Saule: ZORBAX Eclipse XDB-C8, 5 um, 150*4,6 mm 

Temperatun 40 °C 
30 FluBrate: 0,5 ml/min 

lnjektionsvolumen:10 \i\ 
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Detektion: 

Stoppzeit: 

Nachlaufzeit: 

Maximaldruck: 

Eluent A: 

Eluent B: 

Gradient: 



UV 220 nm 
12min 
0 min 
350 bar 

50 mM NaH 2 P0 4 , pH 2,5 mit Perchlorsaure 
Acetonitril 



10 



Zeit [min] 
0 

12 



A [%] 

50 

50 



B [%] Flufc [ml/min] 
50 0,5 
50 0,5 



Als Matrix wurden Extrakte der Fermentationsbruhen verwendet. Vor der 
HPLC wurde jede Probe wird durch ein 0,22 jjm Filter filtriert. Die Proben 
wurden kuhl gehalten und vor Licht geschutzt Zur Kalibrierung wurden 
15 jeweils 50 - 1000 mg/! eingewogen und in THF gelost. Als Standard wurde 
Phytoen verwendet, welches unter den gegebenen Bedingungen eine 
Retentionszeit von 7,7 min. aufweist 



Messung von Lycopin, p-Carotin, Echinenon, Canthaxanthin, 
20 Cryptoxanthin, Zeaxanthin und Astaxanthin mittels HPLC 



Saule: Nucleosil 100-7 C18, 250*4,0 mm (Macherey & Nagel) 

Temperatur: 25 °C 

FluRrate: 1 ,3 ml/min 

lnjektionsvolumen:10 pi 

25 Detektion: 450 nm 

Stoppzeit: 15min 

Nachlaufzeit: 2 min 

Maximaldruck: 250 bar 

Eluent A: 1 0% Aceton, 90% H 2 0 

30 Eluent B: Aceton 

Gradient: 
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Zeit [min] 


A [%] 


B [%] 


FluB [ml/min] 


0 


30 


70 


1,3 


10 


5 


95 


1,3 


12 


5 


95 


1.3 


13 


30 


70 


1.3 



Als Matrix wurden Extrakte der FermentationsbrUhen verwendet. Vor der 
HPLC wurde jede Probe wird durch ein 0,22 urn Filter filtriert. Die Proben 
wurden kOhl gehalten und vor Licht geschOtzt. Zur Kalibrierung wurden 
10 jeweils 10 mg eingewogen und in 100 ml THF gelost. Als Standard wurden 
folgende Carotinoide mit folgenden Retentionszeiten eingesetzt B-Carotin 
(12,5 min), Lycopin (11,7 min), Echinenon (10,9 min), Cryptoxanthin (10,5 
min), Canthaxanthin (8,7 min), Zeaxanthin (7,6 min) und Astaxanthin (6,4 
min) [s. Fig 23]. 

15 

Produktion von Zeaxanthin mit gentechnisch veranderten S tarn men 
von Blakeslea trispora 

Nachfolgend wird beispielhaft die Herstellung von Zeaxanthin mit 
gentechnisch veranderten Organismen (GVO) von Blakeslea trispora 
20 beschrieben. 

Durch Agrobakterium-vermittelte Transformation wurde der Vektor 
pBinAHygBTpTEFI-HPcrtZ in Blakeslea trispora Qbertragen (s.o.). Ein 
Hygromycin-resistenter Klon wurde isoliert und auf eine Kartoffel-Glucose- 
Agarplatte (Merck KGaA, Darmstadt) Qbertragen. 

25 Nach drei Tagen Inkubation bei 26°C wurde ausgehend von dieser Platte 
ein Sporensuspension hergestellt. Ein 250-ml-Erlenmeyerkolben ohne 
Schikanen mit 50 ml Growth-Medium (Maismehl 47 g/l, Sojamehl 23 g/l, 
KH 2 P0 4 0,5 g/l, Thiamin-HCI 2.0 mg/l, pH mit NaOH vor der 
Sterilisation auf 6,2-6,7 eingestellt) wurde mit 1x10 5 Sporen beimpft. 

30 Diese Vorkultur inkubierte 48 Stunden bei 26 °C und 250 upm. Fur die 
Hauptkultur wurde ein 250-ml-Erlenmeyerkolben ohne Schikane 
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enthaltend 40 ml Produktionsmedium mit 4 ml der Vorkultur beimpft und 8 
Tage bei 26 °C und 150 upm inkubjert. Das Produktionsmedium enthielt 
Glucose 50 g/l, Casein Acid Hydrolisate 2 g/l, Hefeextrakt 1 g/l, L- 
Asparagin 2 g/l, KH 2 P0 4 1,5 g/l, MgSCv, x 7 H 2 0 0,5 g/l, Thiamin-HCI 5 
5 mg/l, Span20 10 g/l, Tween 80 1 g/l, Linolsaure 20 g/l, Maisquellwasser 80 
g/l. Nach 72 Stunden erfolgte die Zugabe von Kerosin in einer 
Endkonzentration von 40 g/l Kerosin. 

Nach der Emte der Kulturen werden die verbliebenen ungefahr 35 ml 
Kultur mit Wasser auf 40 ml aufgefOllt. AnschlieBend werden die Zellen im 
10 Hochdruckhomogenisator, Typ Micron Lab 40, Fa. APV Gaulin, 3 x bei 
1500 bar aufgeschlossen. 

Die Suspension mit den aufgeschlossenen Zellen wurde mit 35 ml THF 
versetzt und 60 min bei RT im Dunkeln bei 250 upm geschuttelt. Danach 
wurden 2 g NaCI zugegeben und das Gemisch nochmals geschuttelt. Der 
15 Extraktionsansatz wurde dann 10 min bei 5000 x g zentrifugiert. Die 
gefarbte THF-Phase wurde abgenommen, die Zellmasse war vollstandig 
entfarbt. 

Die THF-Phase wurde am Rotationsverdampfer bei 30 mbar und 30 °C 
auf 1 ml eingeengt und danach nochmals in 1 ml THF aufgenommen. 
20 Nach Zentrifugation 5 min bei 20 000 x g wurde ein Aliquot der oberen 
Phase entnommen und durch HPLC analysiert (Fig. 24, Fig. 23). 



25 
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Patentanspriiche 

1 . Verfahren zur Herstellung eines gentechnisch veranderten Organismus 
der Gattung Blakeslea umfassend 

5 (i) Transformation mindestens einer der Zellen, 

(ii) ggf. Homokaryotisierung der aus (i) erhaltenen Zellen, so dass 
Zellen entstehen, in denen die Kerne in einem oder mehreren 
genetischen Merkmalen alle gleichartig verandert sind und diese 
gentechnische Veranderung zur Auspragung bringen, und 

10 (Hi) Selektion und Anzucht der gentechnisch veranderten Zelle oder 
Zellen. 

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass es sich 
urn Zellen von Pilzen der Art Blakeslea trispora handelt. 

3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass in 
15 der Transformation (i) ein Vector oder freie Nukleinsauren verwendet 

werden. 

4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, dass der in 
der Transformation (i) eingesetzte Vector in das Genom mindestens 
einer der Zellen integriert wird. 

20 5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass der in 
der Transformation (i) eingesetzte Vector einen Promoter und/oder 
einen Terminator enthalt. 

6. Verfahren nach einem der vorhergehenden Ansprilche 3 bis 5, 
dadurch gekennzeichnet dass in der Transformation (i) ein Vector 
25 enthaltend den gpd, pcarB, pcarRA und/oder ptefl Promoter und/oder 
den trpC Terminator eingesetzt wird. 
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7. Verfahren nach einem der vorhergehenden Anspruche 3 bis 6, 
dadurch gekennzeichnet, dass in der Transformation (i) ein Vector 
enthaltend ein Resistenzgen eingesetzt wird. 

5 8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, dass der in 
der Transformation (i) eingesetzte Vector ein Hygromycin- 
Resistenzgen (hph), insbesondere aus E. coli enthalt. 

9. Verfahren nach einem der vorhergehenden Anspruche 5-8, dadurch 
gekennzeichnet, dass der gpd Promotor die Sequenz SEQ ID NO: 1 

10 aufweist. 

10. Verfahren nach einem der vorhergehenden Anspruche 5-8, dadurch 
gekennzeichnet, dass der trpC Terminator die Sequenz SEQ ID NO: 
2 aufweist. 

11. Verfahren nach einem der vorhergehenden Anspruche 5-8, dadurch 
15 gekennzeichnet, dass der tefl Promotor die Sequenz SEQ ID NO: 35 

aufweist. 

12. Verfahren nach einem der Anspruche 6 bis 11, dadurch 
gekennzeichnet, dass der gpd Promotor und der trpC Terminator aus 
Aspergillus nidulans stammen. 

20 13. Verfahren nach einem Anspruche 3 bis 12, dadurch gekennzeichnet, 
dass der Vector die SEQ ID NO: 3 umfasst. 

14. Verfahren nach einem der vorhergehenden Anspruche, dadurch 
gekennzeichnet, dass die Transformation (i) mitteis Agrobakterien, 
Konjugation, Chemikalien, Elektroporation, Beschuss mit DNA- 
25 beladenen Partikeln, Protoplasten oder Mikroinjektion durchgefuhrt 
wird. 
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15. Verfahren nach einem der vorhergehenden AnsprQche, dadurch 
gekennzeichnet, dass in der Homokaryontisierung (ii) ein mutagenes 
Agens eingesetzt wird. 

16. Verfahren nach Anspaich 15, dadurch gekennzeichnet, dass als 
5 mutagenes Agens N-Methyl-N'-nitro-nitrosoguanidin (MNNG), UV- 

Strahlung oder Rontgenstrahlung eingesetzt wird. 

17. Verfahren nach einem der vorhergehenden Anspriiche, dadurch 
gekennzeichnet, dass die Selektion durch Markierung und/oder 
Auswahl der einkernigen Zellen erfolgt. 

w 18. Verfahren nach einem der vorhergehenden Anspriiche 1 - 17, dadurch 
gekennzeichnet, dass in der Selektion 5-Carbon-5-deazariboflavin 
(darf) und Hygromycin (hyg) oder 5-Fluororotat (FOA) und Uracil und 
Hygromycin eingesetzt werden. 

19. Verfahren nach einem der AnsprQche 3 bis 18, dadurch 
15 gekennzeichnet, dass der in der Transformation (i) eingesetzte Vector 

genetische Informationen zur Herstellung von Carotinoiden oder deren 
Vorstufen enthalt. 

20. Verfahren nach einem der AnsprQche 3 bis 19, dadurch 
gekennzeichnet, dass der in der Transformation (i) eingesetzte Vector 

20 genetische Informationen zur Herstellung von Carotinen oder 
Xanthophyllen enthalt. 

21. Verfahren nach einem der AnsprQche 3 bis 20, dadurch 
gekennzeichnet, dass der in der Transformation (i) eingesetzte Vector 
genetische Informationen zur Herstellung von Astaxanthin, Zeaxanthin, 

25 Echinenon, p-Cryptoxanthin, Andonixanthin, Adonirubin, 
Canthaxanthin, 3-Hydroxyechinenon, 3'-Hydroxyechinenon, Lycopin, p- 
Carotin, a-Carotin, Lutein, Bixin, Phytofluen oder Phytoen enthalt. 
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22.Verfahren nach einem der Anspruche 3 bis 21, dadurch 
gekennzeichnet, dass der in der Transformation (i) eingesetzte Vector 
derart gestaltet ist, dass die im Vector enthaltene genetische 
Information in das Genom von Blakeslea trispora eingefuhrt wird 

5 23.Verfahren nach einem der Anspruche 3 bis 22, dadurch 
gekennzeichnet, dass der in der Transformation (i) eingesetzte Vector 
genetische Informationen enthalt, die nach Expression eine Ketolase- 
und/oder Hydroxylase-Aktivitat entfalten. 

24. Verfahren nach Anspruch 23, dadurch gekennzeichnet dass der in 
10 der Transformation (i) eingesetzte Vector die SEQ ID NO: 70 oder 71 

oder 76 und/oder 72 umfasst. 

25. Verfahren nach Anspruch 23 oder 24, dadurch gekennzeichnet, dass 
der in der Transformation (i) eingesetzte Vector eine Sequenz aus der 
Gruppe bestehend aus den SEQ ID NO: 37 - 51 aufweist 

15 26.Verfahren nach einem der Anspruche 3 bis 21, dadurch 
gekennzeichnet, dass der in der Transformation (i) eingesetzte Vector 
derart gestaltet ist, dass die im Vector enthaltene genetische 
Information in derZelle ausgeschaltet wird. 

27. Verfahren nach einem der Anspriiche 3 bis 21 oder 25, dadurch 
20 gekennzeichnet, dass durch die Transformation (i) das Gen der 

Phytoendesaturase ausgeschaltet wird. 

28. Verfahren nach Anspruch 27, dadurch gekennzeichnet, dass der in 
der Transformation (i) eingesetzte Vector die SEQ ID NO: 69 umfasst. 

29. Verfahren nach Anspruch 27 oder 28, dadurch gekennzeichnet, dass 
25 der in der Transformation (i) eingesetzte Vector die Sequenz SEQ ID 

NO: 62 aufweist. 
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30.Verfahren nach einem der AnsprQche 3 bis 21, dadurch 
gekennzeichnet, dass durch die Transformation das Gen der 
Lycopincyclase ausgeschaltet wird. 

31-Genetisch veranderte mehrkernige Zellen der zur Gattung Blakeslea 
5 gehSrenden Pilze, insbesondere Blakesiea trispora erhaltlich nach 
einem der vorhergehenden Anspruche. 

32. Verwendung der Zellen nach Anspruch 30 oder eines aus ihnen 
gebildeten Mycels zur Herstellung von Carotinoiden oder deren 
Vorstufen. 

10 33. Verwendung nach Anspruch 30 oder 31 zur Herstellung von Carotinen 
oder Xanthophyllen. 

34. Verwendung nach einem der AnsprOche 30 bis 32 zur Herstellung von 
Astaxanthin, Zeaxanthin, Echinenon, p-Cryptoxanthin, Andonixanthin, 
Adonirubin, Canthaxanthin, 3-Hydroxyechinenon, 3- 

15 Hydroxyechinenon, Lycopin, p-Carotin, a-Carotin, Lutein, Bixin, 
Phytofluen oder Phytoen. 

35. Promotor mit der Sequenz SEQ ID NO: 1 oder 35 zur Verwendung in 
dem Verfahren nach einem der Anspruche 1-29. 

36. Terminator mit der Sequenz SEQ ID NO: 2 zur Verwendung in dem 
20 Verfahren nach einem der Anspruche 1 - 29. 

37. Vector umfassend die SEQ ID NO: 3 zur Verwendung in dem 
Verfahren nach einem der AnsprQche 1 - 29. 

38. Vector nach Anspruch 36 zur Verwendung . in dem Verfahren nach 
einem der AnsprQche 1-29 umfassend die SEQ ID NO: 69 und/oder 

25 die SEQ ID NO: 70 oder 71 und/oder 72 oder 76. 
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Fig. 1: Vektor pANsCosl 
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Kg. 2: Vektor pBinAHyg 
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Fig. 4: Plasmid pBinAHygBTpyrG-SCO 
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Fig. 5: Plasmid pBinAHygBTpTEFI-HPcrtZ 
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Fig. 6: Plasmid pBinAHyg-BTpcarRA-HPcrtZ 
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Fig. 7: Plasmid pBinAHygBTpcarB-HPcrtZ 
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Fig. 8: Plasmid p-carRA-HPcrtZ-TAG-3'carA-lR 
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Fig. 9: Plasmid p-carRA-HPcrtZ-GCG-3'carA-IR 
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Fig. 10: Plasmid pBinAHygBTpTEFI-EUcrtZ 
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Fig. 11: Plasmid pBinAHygBTpcarRA-EUcrtZ 
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Fig. 12: Plasmid pBinAHygBTpcarB-EUcrtZ 
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Fig. 14: Plasmid pBinAHyg-carRcrtZcarA 
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Fig. 15: Plasmid pBinAHyg-BTpTEFI-NPcrtW 
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Fig. 16: Plasmid pBinAHyg_BTpcarRA_NPcrtW 
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Fig. 17: Plasmid pBinAHyg-BTpcarB-NPcrtW 
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Fig. 18: Plasmid pBinAHygBTpcarRA-HPcrtZ-BTpcarRA-NpucrtW 
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Fig. 19: Plasmid pBinAHygBTpcarRA-EUcrtZ-BTpcarRA-NpucrtW 
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Fig. 20: carB 
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Fig. 21: CDS von carB 
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Fig. 22: Vektor pBinAHygAcarB 
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Fig. 23: HPLC Standard 
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Fig. 24: HPLC 
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<110> BASF AG 

<120> Verfahren zur gentechnischen Veranderung von Organismen der 

Gattung Blakeslea, entsprechende Organismen und deren Verwendung 

<130> ? 

<160> 80 

<170> Patentln version 3.2 

<210> 1 

<211> 2160 

<212> DNA 

<213> Artificial 

<220> 

<2 2 3 > Promo tor 
<400> 1 

ctttcgacac tgaaatacgt cgagcctgct ccgcttggaa gcggcgagga gcctcgtcct 60 

gtcacaacta ccaacatgga gtacgataag ggccagttcc gccagctcat taagagccag 120 

ttcatgggcg ttggcatgat ggccgtcatg catctgtact tcaagtacac caacgctctt 180 

ctgatccagt cgatcatccg ctgaaggcgc tttcgaatct ggttaagatc cacgtcttcg 240 

ggaagccagc gactggtgac ctccagcgtc cctttaaggc tgccaacagc tttctcagcc 300 

agggccagcc caagaccgac aaggcctccc tccagaacgc cgagaagaac tggaggggtg 360 

gtgtcaagga ggagtaagct ccttattgaa gtcggaggac ggagcggtgt caagaggata 420 

ttcttcgact ctgtattata gataagatga tgaggaattg gaggtagcat agcttcattt 480 

ggatttgctt tccaggctga gactctagct tggagcatag agggtccttt ggctttcaat 540 

attctcaagt atctcgagtt tgaacttatt ccctgtgaac cttttattca ccaatgagca 600 
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ttggaatgaa catgaatctg aggactgcaa tcgccatgag gttttcgaaa tacatccgga 660 

tgtcgaaggc ttggggcacc tgcgttggtt gaatttagaa cgtggcacta ttgatcatcc 720 

gatagctctg caaagggcgt tgcacaatgc aagtcaaacg ttgctagcag ttccaggtgg 780 

aatgttatga tgagcattgt attaaatcag gagatatagc ■ atgatctcta gttagctcac 840 

cacaaaagtc agacggcgta accaaaagtc acacaacaca agctgtaagg atttcggcac 900 

ggctacggaa gacggagaag ccaccttcag tggactcgag taccatttaa ttctatttgt 960 

gtttgatcga gacctaatac agcccctaca acgaccatca aagtcgtata gctaccagtg 102 0 

aggaagtgga ctcaaatcga cttcagcaac atctcctgga taaactttaa gcctaaacta 1080 

tacagaataa gataggtgga gagcttatac cgagctccca aatctgtcca gatcatggtt 1140 

gaccggtgcc tggatcttcc tatagaatca tccttattcg ttgacctagc tgattctgga 1200 

gtgacccaga gggtcatgac ttgagcctaa aatccgccgc ctccaccatt tgtagaaaaa 1260 

tgtgacgaac tcgtgagctc tgtacagtga ccggtgactc tttctggcat gcggagagac 1320 

ggacggacgc agagagaagg gctgagtaat aagccactgg ccagacagct ctggcggctc 1380 

tgaggtgcag tggatgatta ttaatccggg accggccgcc cctccgcccc gaagtggaaa 1440 

ggctggtgtg cccctcgttg accaagaatc tattgcatca tcggagaata tggagcttca 1500 

tcgaatcacc ggcagtaagc gaaggagaat gtgaagccag gggtgtatag ccgtcggcga 1560 

aatagcatgc cattaaccta ggtacagaag tccaattgct tccgatctgg taaaagattc 1620 

acgagatagt accttctccg aagtaggtag agcgagtacc cggcgcgtaa gctccctaat 1680 

tggcccatcc ggcatctgta gggcgtccaa atatcgtgcc tctcctgctt tgcccggtgt 1740 

atgaaaccgg aaaggccgct caggagctgg ccagcggcgc agaccgggaa cacaagctgg 1800 

cagtcgaccc atccggtgct ctgcactcga cctgctgagg tccctcagtc cctggtaggc 1860 
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agctttgccc cgtctgtccg cccggtgtgt cggcggggtt gacaaggtcg ttgcgtcagt 1920 

ccaacatttg ttgccatatt ttcctgctct ccccaccagc tgctcttttc ttttctcttt 1980 

cttttcccat cttcagtata ttcatcttcc catccaagaa cctttatttc ccctaagtaa 2040 

gtactttgct acatccatac tccatccttc ccatccctta ttcctttgaa cctttcagtt 2100 

cgagctttcc cacttcatcg cagcttgact aacagctacc ccgcttgagc agacatcacc 2160 



<210> 2 

<211> 774 

<212> DNA 

<213> Artificial 

<220> 

<223> Terminator 



<220> 

<221> misc_feature 

<222> (267) . . (267) 

<223> n is a, c, g # or t 

<220> 

<221> mis cofeature 

<222> (475) . . (475) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (566) . . (566) 

<223> n is a, c, g, or t 



<400> 2 

cgatccactt aacgttactg aaatcatcaa acagcttgac gaatctggat ataagatcgt 60 

tggtgtcgat gtcagctccg gagttgagac aaatggtgtt caggatctcg ataagatacg 120 

ttcatttgtc caagcagcaa agagtgcctt ctagtgattt aatagctcca tgtcaacaag 180 
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aataaaacgc gttttcgggt ttacctcttc cagatacagc tcatctgcaa tgcattaatg 240 

cattgactgc aacctagtaa cgccttncag gctccggcga agagaagaat agcttagcag 300 

agctattttc attttcggga gacgagatca agcagatcaa cggtcgtcaa gagacctacg 360 

agactgagga atccgctctt ggctccacgc gactatatat ttgtctctaa ttgtactttg 420 

acatgctcct cttctttact ctgatagctt gactatgaaa attccgtcac cagcncctgg 480 

gttcgcaaag ataattgcat gtttcttcct tgaactctca agcctacagg acacacattc 540 

atcgtaggta taaacctcga aatcanttcc tactaagatg gtatacaata gtaaccatgc 600 

atggttgcct agtgaatgct ccgtaacacc caatacgccg gccgaaactt ttttacaact 660 

ctcctatgag tcgtttaccc agaatgcaca ggtacacttg tttagaggta atccttcttt 720 

ctagctagaa gtcctcgtgt actgtgtaag cgcccactcc acatctccac tcga 774 



<210> 3 

<211> 15739 

<212> DNA 

<213> Artificial 

<220> 

<223> Vector 



<220> 

<221> misc_feature 

<222> (3471) . . (3471) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (3679) . . (3679) 

<223> n is a, c, g, or t 



<220> 
<221> 



misc_feature 
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<222> (3770) . . (3770) 
<223> n is a, c, g, or t 

<400> 3 

gatctttcga cactgaaata cgtcgagcct gctccgcttg gaagcggcga ggagcctcgt 60 

cctgtcacaa ctaccaacat ggagtacgat aagggccagt tccgccagct cattaagagc 120 

cagttcatgg gcgttggcat gatggccgtc atgcatctgt acttcaagta caccaacgct 180 

cttctgatcc agtcgatcat ccgctgaagg cgctttcgaa tctggttaag atccacgtct 240 

tcgggaagcc agcgactggt gacctccagc gtccctttaa ggctgccaac agctttctca 300 

gccagggcca gcccaagacc gacaaggcct ccctccagaa cgccgagaag aactggaggg 360 

gtggtgtcaa ggaggagtaa gctccttatt gaagtcggag gacggagcgg tgtcaagagg 420 

atattcttcg actctgtatt atagataaga tgatgaggaa ttggaggtag catagcttca 480 

tttggatttg ctttccaggc tgagactcta gcttggagca tagagggtcc tttggctttc 540 

aatattctca agtatctcga gtttgaactt attccctgtg aaccttttat tcaccaatga 600 

gcattggaat gaacatgaat ctgaggactg caatcgccat gaggttttcg aaatacatcc 660 

ggatgtcgaa ggcttggggc acctgcgttg gttgaattta gaacgtggca ctattgatca 720 

tccgatagct ctgcaaaggg cgttgcacaa tgcaagtcaa acgttgctag cagttccagg 780 

tggaatgtta tgatgagcat tgtattaaat caggagatat agcatgatct ctagttagct 840 

caccacaaaa gtcagacggc gtaaccaaaa gtcacacaac acaagctgta aggatttcgg 900 

cacggctacg gaagacggag aagccacctt cagtggactc gagtaccatt taattctatt 960 

tgtgtttgat cgagacctaa tacagcccct acaacgacca tcaaagtcgt atagctacca 1020 

gtgaggaagt ggactcaaat cgacttcagc aacatctcct ggataaactt taagcctaaa 1080 

ctatacagaa taagataggt ggagagctta taccgagctc ccaaatctgt ccagatcatg 1140 
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gttgaccggt gcctggatct tcctatagaa tcatccttat tcgttgacct agctgattct 1200 

ggagtgaccc agagggtcat gacttgagcc taaaatccgc cgcctccacc atttgtagaa 1260 

aaatgtgacg aactcgtgag ctctgtacag tgaccggtga ctctttctgg catgcggaga 1320 

gacggacgga cgcagagaga agggctgagt aataagccac tggccagaca gctctggcgg 1380 

ctctgaggtg cagtggatga ttattaatcc gggaccggcc gcccctccgc cccgaagtgg 1440 

aaaggctggt gtgcccctcg ttgaccaaga atctattgca tcatcggaga atatggagct 1500 

tcatcgaatc accggcagta agcgaaggag aatgtgaagc caggggtgta tagccgtcgg 1560 

cgaaatagca tgccattaac ctaggtacag aagtccaatt gcttccgatc tggtaaaaga 1620 

ttcacgagat agtaccttct ccgaagtagg tagagcgagt acccggcgcg taagctccct 1680 

aattggccca tccggcatct gtagggcgtc caaatatcgt gcctctcctg ctttgcccgg 1740 

tgtatgaaac cggaaaggcc gctcaggagc tggccagcgg cgcagaccgg gaacacaagc 1800 

tggcagtcga cccatccggt gctctgcact cgacctgctg aggtccctca gtccctggta 1860 

ggcagctttg ccccgtctgt ccgcccggtg tgtcggcggg gttgacaagg tcgttgcgtc 1920 

agtccaacat ttgttgccat attttcctgc tctccccacc agctgctctt ttcttttctc 1980 

tttcttttcc catcttcagt atattcatct tcccatccaa gaacctttat ttcccctaag 2040 

taagtacttt gctacatcca tactccatcc ttcccatccc ttattccttt gaacctttca 2100 

gttcgagctt tcccacttca tcgcagcttg actaacagct accccgcttg agcagacatc 2160 

accatgcctg aactcaccgc gacgtctgtc gagaagtttc tgatcgaaaa gttcgacagc 2220 

gtctccgacc tgatgcagct ctcggagggc gaagaatctc gtgctttcag cttcgatgta 2280 

ggagggcgtg gatatgtcct gcgggtaaat agctgcgccg atggtttcta caaagatcgt 2340 

tatgtttatc ggcactttgc atcggccgcg ctcccgattc cggaagtgct tgacattggg 2400 
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gaattcagcg agagcctgac ctattgcatc tcccgccgtg cacagggtgt cacgttgcaa 2460 

gacctgcctg aaaccgaact gcccgctgtt ctgcagccgg tcgcggaggc catggatgcg 2520 

atcgctgcgg ccgatcttag ccagacgagc gggttcggcc cattcggacc gcaaggaatc 2580 

ggtcaataca ctacatggcg tgatttcata tgcgcgattg ctgatcccca tgtgtatcac 2640 

tggcaaactg tgatggacga caccgtcagt gcgtccgtcg cgcaggctct cgatgagctg 2700 

atgctttggg ccgaggactg ccccgaagtc cggcacctcg tgcacgcgga tttcggctcc 2760 

aacaatgtcc tgacggacaa tggccgcata acagcggtca ttgactggag cgaggcgatg 2820 

ttcggggatt cccaatacga ggtcgccaac atcttcttct ggaggccgtg gttggcttgt 2880 

atggagcagc agacgcgcta cttcgagcgg aggcatccgg agcttgcagg atcgccgcgg 2940 

ctccgggcgt atatgctccg cattggtctt gaccaactct atcagagctt ggttgacggc 3000 

aatttcgatg atgcagcttg ggcgcagggt cgatgcgacg caatcgtccg atccggagcc 3 060 

gggactgtcg ggcgtacaca aatcgcccgc agaagcgcgg ccgtctggac cgatggctgt 3120 

gtagaagtac tcgccgatag tggaaaccga cgccccagca ctcgtccgag ggcaaaggaa 3180 

tagagtagat gccgaccgcg ggatcgatcc acttaacgtt actgaaatca tcaaacagct 3240 

tgacgaatct ggatataaga tcgttggtgt cgatgtcagc tccggagttg agacaaatgg 3300 

tgttcaggat ctcgataaga tacgttcatt tgtccaagca gcaaagagtg ccttctagtg 3360 

atttaatagc tccatgtcaa caagaataaa aogcgttttc gggtttacct cttccagata 3420 

cagctcatct gcaatgcatt aatgcattga ctgcaaccta gtaacgcctt ncaggctccg 3480 

gcgaagagaa gaatagctta gcagagctat tttcattttc gggagacgag atcaagcaga 3540 

tcaacggtcg tcaagagacc tacgagactg aggaatccgc tcttggctcc acgcgactat 3600 

atatttgtct ctaattgtac tttgacatgc tcctcttctt tactctgata gcttgactat 3660 
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gaaaattccg tcaccagcnc ctgggttcgc aaagataatt gcatgtttct tccttgaact 3720 

ctcaagccta caggacacac attcatcgta ggtataaacc tcgaaatcan ttcctactaa 3780 

gatggtatac aatagtaacc atgcatggtt gcctagtgaa tgctccgtaa cacccaatac 3840 

gccggccgaa acttttttac aactctccta tgagtcgttt acccagaatg cacaggtaca 3900 

cttgtttaga ggtaatcctt ctttctagct agaagtcctc gtgtactgtg taagcgccca 3960 

ctccacatct ccactcgacc tgcaggcatg caagcttggc gtaatcatgg tcatagctgt 4020 

ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc ggaagcataa 4080 

agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg ttgcgctcac 4140 

tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg 4200 

cggggagagg cggtttgcgt attgggccaa agacaaaagg gcgacattca accgattgag 4260 

ggagggaagg taaatattga cggaaattat tcattaaagg tgaattatca ccgtcaccga 4320 

cttgagccat ttgggaatta gagccagcaa aatcaccagt agcaccatta ccattagcaa 4380 

ggccggaaac gtcaccaatg aaaccatcga tagcagcacc gtaatcagta gcgacagaat 4440 

caagtttgcc tttagcgtca gactgtagcg cgttttcatc ggcattttcg gtcatagccc 4500 

ccttattagc gtttgccatc ttttcataat caaaatcacc ggaaccagag ccaccaccgg 4560 

aaccgcctcc ctcagagccg ccaccctcag aaccgccacc ctcagagcca ccaccctcag 4620 

agccgccacc agaaccacca ccagagccgc cgccagcatt gacaggaggc ccgatctagt 4680 

aacatagatg acaccgcgcg cgataattta tcctagtttg cgcgctatat tttgttttct 4740 

atcgcgtatt aaatgtataa ttgcgggact ctaatcataa aaacccatct cataaataac 4800 

gtcatgcatt acatgttaat tattacatgc ttaacgtaat tcaacagaaa ttatatgata 4860 

atcatcgcaa gaccggcaac aggattcaat cttaagaaac tttattgcca aatgtttgaa 4920 



WO 2004/063358 PCT/EP2004/000100 

9/358 

cgatcgggga tcatccgggt ctgtggcggg aactccacga aaatatccga acgcagcaag 4980 

atatcgcggt gcatctcggt cttgcctggg cagtcgccgc cgacgccgtt gatgtggacg 5040 

ccgggcccga tcatattgtc gctcaggatc gtggcgttgt gcttgtcggc cgttgctgtc 5100 

gtaatgatat cggcaccttc gaccgcctgt tccgcagaga tcccgtgggc gaagaactcc 5160 

agcatgagat ccccgcgctg gaggatcatc cagccggcgt cccggaaaac gattccgaag 5220 

cccaaccttt catagaaggc ggcggtggaa tcgaaatctc gtgatggcag gtfcgggcgtc 5280 

gcttggtcgg tcatttcgaa ccccagagtc ccgctcagaa gaactcgtca agaaggcgat 5340 

agaaggcgat gcgctgcgaa tcgggagcgg cgataccgta aagcacgagg aagcggtcag 5400 

cccattcgcc gccaagctct tcagcaatat cacgggtagc caacgctatg tcctgatagc 5460 

ggtccgccac acccagccgg ccacagtcga tgaatccaga aaagcggcca ttttccacca 5520 

tgatattcgg caagcaggca tcgccatggg tcacgacgag atcatcgccg tcgggcatgc 5580 

gcgccttgag cctggcgaac agttcggctg gcgcgagccc ctgatgctct tcgtccagat 5640 

catcctgatc gacaagaccg gcttccatcc gagtacgtgc tcgctcgatg cgatgtttcg 5700 

cttggtggtc gaatgggcag gtagccggat caagcgtatg cagccgccgc attgcatcag 5760 

ccatgatgga tactttctcg gcaggagcaa ggtgagatga caggagatcc tgccccggca 5820 

cttcgcccaa tagcagccag tcccttcccg cttcagtgac aacgtcgagc acagctgcgc 5880 

aaggaacgcc cgtcgtggcc agccacgata gccgcgctgc ctcgtcctgc agttcattca 5940 

gggcaccgga caggtcggtc ttgacaaaaa gaaccgggcg cccctgcgct gacagccgga 6000 

acacggcggc atcagagcag ccgattgtct gttgtgccca gtcatagccg aatagcctct 6060 

ccacccaagc ggccggagaa cctgcgtgca atccatcttg ttcaatcatg cgaaacgatc 6120 

cagatccggt gcagattatt tggattgaga gtgaatatga gactctaatt ggataccgag 6180 
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gggaatttat ggaacgtcag tggagcattt ttgacaagaa atatttgcta gctgatagtg 6240 

accttaggcg acttttgaac gcgcaataat ggtttctgac gtatgtgctt agctcattaa 6300 

actccagaaa cccgcggctg agtggctcct tcaacgttgc ggttctgtca gttccaaacg 6360 

taaaacggct tgtcccgcgt catcggcggg ggtcataacg tgactccctt aattctccgc 6420 

tcatgatcag attgtcgttt cccgccttca gtttaaacta tcagtgtttg acaggatata 6480 

ttggcgggta aacctaagag aaaagagcgt ttattagaat aatcggatat ttaaaagggc 6540 

gtgaaaaggt ttatccgttc gtccatttgt atgtgcatgc caaccacagg gttccccaga 6600 

tctggcgccg gccagcgaga cgagcaagat tggccgccgc ccgaaacgat ccgacagcgc 6660 

gcccagcaca ggtgcgcagg caaattgcac caacgcatac agcgccagca gaatgccata 6720 
gtgggcggtg acgtcgttcg agtgaaccag atcgcgcagg aggcccggca gcaccggcat 6780 
aatcaggccg atgccgacag cgtcgagcgc gacagtgctc agaattacga tcaggggtat 6840 
gttgggtttc acgtctggcc tccggaccag cctccgctgg tccgattgaa cgcgcggatt 6900 
ctttatcact gataagttgg tggacatatt atgtttatca gtgataaagt gtcaagcatg 6960 
acaaagttgc agccgaatac agtgatccgt gccgccctgg acctgttgaa cgaggtcggc 7020 
gtagacggtc tgacgacacg caaactggcg gaacggttgg gggttcagca gccggcgctt 7080 
tactggcact tcaggaacaa gcgggcgctg ctcgacgcac tggccgaagc catgctggcg 7140 
gagaatcata cgcattcggt gccgagagcc gacgacgact ggcgctcatt tctgatcggg 7200 
aatgcccgca gcttcaggca ggcgctgctc gcctaccgcg atggcgcgcg catccatgcc 7260 
ggcacgcgac cgggcgcacc gcagatggaa acggccgacg cgcagcttcg cttcctctgc 7320 
gaggcgggtt tttcggccgg ggacgccgtc aatgcgctga tgacaatcag ctacttcact 7380 
gttggggccg tgcttgagga gcaggccggc gacagcgatg ccggcgagcg cggcggcacc 7440 
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gttgaacagg ctccgctctc gccgctgttg cgggccgcga tagacgcctt cgacgaagcc 7500 

ggtccggacg cagcgttcga gcagggactc gcggtgattg tcgatggatt ggcgaaaagg 7560 

aggctcgttg tcaggaacgt tgaaggaccg agaaagggtg acgattgatc aggaccgctg 7620 

ccggagcgca acccactcac tacagcagag ccatgtagac aacatcccct ccccctttcc 7680 

accgcgtcag acgcccgtag cagcccgcta cgggcttttt catgccctgc cctagcgtcc 7740 

aagcctcacg gccgcgctcg gcctctctgg cggccttctg gcgctcttcc gcttcctcgc 7800 

tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 7860 

cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 7920 

gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 7980 

gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 8040 

gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga .8100 

ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgcttttcc 8160 

gctgcataac cctgcttcgg ggtcattata gcgatttttt cggtatatcc atcctttttc 8220 

gcacgatata caggattttg ccaaagggtt cgtgtagact ttccttggtg tatccaacgg 8280 

cgtcagccgg gcaggatagg tgaagtaggc ccacccgcga gcgggtgttc cttcttcact 8340 

gtcccttatt cgcacctggc ggtgctcaac gggaatcctg ctctgcgagg ctggccggct 8400 

accgccggcg taacagatga gggcaagcgg atggctgatg aaaccaagcc aaccaggaag 8460 

ggcagcccac ctatcaaggt gtactgcctt ccagacgaac gaagagcgat tgaggaaaag 8520 

gcggcggcgg ccggcatgag cctgtcggcc tacctgctgg ccgtcggcca gggctacaaa 8580 

atcacgggcg tcgtggacta tgagcacgtc cgcgagctgg cccgcatcaa tggcgacctg 8640 

ggccgcctgg gcggcctgct gaaactctgg ctcaccgacg acccgcgcac ggcgcggttc 8700 
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ggtgatgcca cgatcctcgc cctgctggcg aagatcgaag agaagcagga cgagcttggc 8760 

aaggtcatga tgggcgtggt ccgcccgagg gcagagccat gactttttta gccgctaaaa 8820 

cggccggggg gtgcgcgtga ttgccaagca cgtccccatg cgctccatca agaagagcga 8880 

cttcgcggag ctggtgaagt acatcaccga cgagcaaggc aagaccgagc gcctttgcga 8940 

cgctcaccgg gctggttgcc ctcgccgctg ggctggcggc cgtctatggc cctgcaaacg 9000 

cgccagaaac gccgtcgaag ccgtgtgcga gacaccgcgg ccgccggcgt tgtggatacc 9060 

tcgcggaaaa cttggccctc actgacagat gaggggcgga cgttgacact tgaggggccg 9120 

actcacccgg cgcggcgttg acagatgagg ggcaggctcg atttcggccg gcgacgtgga 9180 

gctggccagc ctcgcaaatc ggcgaaaacg cctgatttta cgcgagtttc ccacagatga 9240 

tgtggacaag cctggggata agtgccctgc ggtattgaca cttgaggggc gcgactactg 9300 

acagatgagg ggcgcgatcc ttgacacttg aggggcagag tgctgacaga tgaggggcgc 9360 

acctattgac atttgagggg ctgtccacag gcagaaaatc cagcatttgc aagggtttcc 9420 

gcccgttttt cggccaccgc taacctgtct tttaacctgc ttttaaacca atatttataa 9480 

accttgtttt taaccagggc tgcgccctgt gcgcgtgacc gcgcacgccg aaggggggtg 9540 

cccccccttc tcgaaccctc ccggcccgct aacgcgggcc tcccatcccc ccaggggctg 9600 

cgcccctcgg ccgcgaacgg cctcacccca aaaatggcag cgctggcagt ccttgccatt 9660 

gccgggatcg gggcagtaac gggatgggcg atcagcccga gcgcgacgcc cggaagcatt 9720 

gacgtgccgc aggtgctggc atcgacattc agcgaccagg tgccgggcag tgagggcggc 9780 

ggcctgggtg gcggcctgcc cttcacttcg gccgtcgggg cattcacgga cttcatggcg 9840 

gggccggcaa tttttacctt gggcattctt ggcatagtgg tcgcgggtgc cgtgctcgtg 9900 

ttcgggggtg cgataaaccc agcgaaccat ttgaggtgat aggtaagatt ataccgaggt 9960 
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atgaaaacga gaattggacc tttacagaat tactctatga agcgccatat ttaaaaagct 10020 
accaagacga agaggatgaa gaggatgagg aggcagattg ccttgaatat attgacaata 10080 
ctgataagat aatatatctt ttatatagaa gatatcgccg tatgtaagga tttcaggggg 10140 
caaggcatag gcagcgcgct tatcaatata tctatagaat gggcaaagca taaaaacttg 10200 
catggactaa tgcttgaaac ccaggacaat aaccttatag cttgtaaatt ctatcataat 10260 
tgggtaatga ctccaactta ttgatagtgt tttatgttca gataatgccc gatgactttg 10320 
tcatgcagct ccaccgattt tgagaacgac agcgacttcc gtcccagccg tgccaggtgc 10380 
tgcctcagat tcaggttatg ccgctcaatt cgctgcgtat atcgcttgct gattacgtgc 10440 
agctttccct tcaggcggga ttcatacagc ggccagccat ccgtcatcca tatcaccacg 10500 
tcaaagggtg acagcaggct cataagacgc cccagcgtcg ccatagtgcg ttcaccgaat 10560 
acgtgcgcaa caaccgtctt ccggagactg tcatacgcgt aaaacagcca gcgctggcgc 1062 0 
gatttagccc cgacatagcc ccactgttcg tccatttccg cgcagacgat gacgtcactg 10680 
cccggctgta tgcgcgaggt taccgactgc ggcctgagtt ttttaagtga cgtaaaatcg 10740 
tgttgaggcc aacgcccata atgcgggctg ttgcccggca tccaacgcca ttcatggcca 10800 
tatcaatgat tttctggtgc gtaccgggtt gagaagcggt gtaagtgaac tgcagttgcc 10860 
atgttttacg gcagtgagag cagagatagc gctgatgtcc ggcggtgctt ttgccgttac 1092 0 
gcaccacccc gtcagtagct gaacaggagg gacagctgat agacacagaa gccactggag 10980 
cacctcaaaa acaccatcat acactaaatc agtaagttgg cagcatcacc cataattgtg 11040 
gtttcaaaat cggctccgtc gatactatgt tatacgccaa ctttgaaaac aactttgaaa 11100 
aagctgtttt ctggtattta aggttttaga atgcaaggaa cagtgaattg gagttcgtct 11160 
tgttataatt agcttcttgg ggtatcttta aatactgtag aaaagaggaa ggaaataata 1122 0 
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aatggctaaa atgagaatat caccggaatt gaaaaaactg atcgaaaaat accgctgcgt 11280 

aaaagatacg gaaggaatgt ctcctgctaa ggtatataag ctggtgggag aaaatgaaaa 11340 

cctatattta aaaatgacgg acagccggta taaagggacc acctatgatg tggaacggga 11400 

aaaggacatg atgctatggc tggaaggaaa gctgcctgtt ccaaaggtcc tgcactttga 11460 

acggcatgat ggctggagca atctgctcat gagtgaggcc gatggcgtcc tttgctcgga 11520 

agagtatgaa gatgaacaaa gccctgaaaa gattatcgag ctgtatgcgg agtgcatcag 11580 

gctctttcac tccatcgaca tatcggattg tccctatacg aatagcttag acagccgctt 11640 

agccgaattg gattacttac tgaataacga tctggccgat gtggattgcg aaaactggga 11700 

agaagacact ccatttaaag atccgcgcga gctgtatgat tttttaaaga cggaaaagcc 11760 

cgaagaggaa cttgtctttt cccacggcga cctgggagac agcaacatct ttgtgaaaga 11820 

tggcaaagta agtggcttta ttgatcttgg gagaagcggc agggcggaca agtggtatga 11880 

cattgccttc tgcgtccggt cgatcaggga ggatatcggg gaagaacagt atgtcgagct 11940 

attttttgac ttactgggga tcaagcctga ttgggagaaa ataaaatatt atattttact 12000 

ggatgaattg ttttagtacc tagatgtggc gcaacgatgc cggcgacaag caggagcgca 12060 

ccgacttctt ccgcatcaag tgttttggct ctcaggccga ggcccacggc aagtatttgg 12120 

gcaaggggtc gctggtattc gtgcagggca agattcggaa taccaagtac gagaaggacg 12180 

gccagacggt ctacgggacc gacttcattg ccgataaggt ggattatctg gacaccaagg 12240 

caccaggcgg gtcaaatcag gaataagggc acattgcccc ggcgtgagtc ggggcaatcc 12300 

cgcaaggagg gtgaatgaat cggacgtttg accggaaggc atacaggcaa gaactgatcg 12360 

acgcggggtt ttccgccgag gatgccgaaa ccatcgcaag ccgcaccgtc atgcgtgcgc 12420 

cccgcgaaac cttccagtcc gtcggctcga tggtccagca agctacggcc aagatcgagc 12480 
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gcgacagcgt gcaactggct ccccctgccc tgcccgcgcc atcggccgcc gtggagcgtt 12540 
cgcgtcgtct cgaacaggag gcggcaggtt tggcgaagtc gatgaccatc gacacgcgag 12600 
gaactatgac gaccaagaag cgaaaaaccg ccggcgagga cctggcaaaa caggtcagcg 12660 
aggccaagca ggccgcgttg ctgaaacaca cgaagcagca gatcaaggaa atgcagcttt 12720 
ccttgttcga tattgcgccg tggccggaca cgatgcgagc gatgccaaac gacacggccc 12780 
gctctgccct gttcaccacg cgcaacaaga aaatcccgcg cgaggcgctg caaaacaagg 12840 
tcattttcca cgtcaacaag gacgtgaaga tcacctacac cggcgtcgag ctgcgggccg 12900 
acgatgacga actggtgtgg cagcaggtgt tggagtacgc gaagcgcacc cctatcggcg 12960 
agccgatcac ctfccacgttc tacgagcttt gccaggacct gggctggtcg atcaatggcc 13020 
ggtattacac gaaggccgag gaatgcctgt cgcgcctaca ggcgacggcg atgggcttca 13080 
cgtccgaccg cgttgggcac ctggaatcgg tgtcgctgct gcaccgcttc cgcgtcctgg 13140 
accgtggcaa gaaaacgtcc cgttgccagg tcctgatcga cgaggaaatc gtcgtgctgt 13200 
ttgctggcga ccactacacg aaattcatat gggagaagta ccgcaagctg tcgccgacgg 13260 
cccgacggat gttcgactat ttcagctcgc accgggagcc gtacccgctc aagctggaaa 13320 
ccttccgcct catgtgcgga tcggattcca cccgcgtgaa gaagtggcgc gagcaggtcg 13380 
gcgaagcctg cgaagagttg cgaggcagcg gcctggtgga acacgcctgg gtcaatgatg 13440 
acctggtgca ttgcaaacgc tagggccttg tggggtcagt tccggctggg ggttcagcag 13500 
ccagcgcttt actggcattt caggaacaag cgggcactgc tcgacgcact tgcttcgctc 13560 
agtatcgctc gggacgcacg gcgcgctcta cgaactgccg ataaacagag gattaaaatt 13620 
gacaattgtg attaaggctc agattcgacg gcttggagcg gccgacgtgc aggatttccg 13680 
cgagatccga ttgtcggccc tgaagaaagc tccagagatg ttcgggtccg tttacgagca 13740 
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cgaggagaaa aagcccatgg aggcgttcgc tgaacggttg cgagatgccg tggcattcgg 13800 

cgcctacatc gacggcgaga tcattgggct gtcggtcttc aaacaggagg acggccccaa 13860 

ggacgctcac aaggcgcatc tgtccggcgt tttcgtggag cccgaacagc gaggccgagg 13920 

ggtcgccggt atgctgctgc gggcgttgcc ggcgggttta ttgctcgtga tgatcgtccg 13980 

acagattcca acgggaatct ggtggatgcg catcttcatc ctcggcgcac ttaatatttc 14040 

gctattctgg agcttgttgt ttatttcggt ctaccgcctg ccgggcgggg tcgcggcgac 14100 

ggtaggcgct gtgcagccgc tgatggtcgt gttcatctct gccgctctgc taggtagccc 14160 

gatacgattg atggcggtcc tgggggctat ttgcggaact gcgggcgtgg cgctgttggt 14220 

gttgacacca aacgcagcgc tagatcctgt cggcgtcgca gcgggcctgg cgggggcggt 14280 

ttccatggcg ttcggaaccg tgctgacccg caagtggcaa cctcccgtgc ctctgctcac 14340 

ctttaccgcc tggcaactgg cggccggagg acttctgctc gttccagtag ctttagtgtt 14400 

tgatccgcca atcccgatgc ctacaggaac caatgttctc ggcctggcgt ggctcggcct 14460 

gatcggagcg ggtttaacct acttcctttg gttccggggg atctcgcgac tcgaacctac 14520 

agttgtttcc ttactgggct ttctcagccc cagatctggg gtcgatcagc cggggatgca 14580 

tcaggccgac agtcg'gaact tcgggtcccc gacctgtacc attcggtgag caatggatag 14640 

gggagttgat atcgtcaacg ttcacttcta aagaaatagc gccactcagc ttcctcagcg 14700 

gctttatcca gcgatttcct attatgtcgg catagttctc aagatcgaca gcctgtcacg 14760 

gttaagcgag aaatgaataa gaaggctgat aattcggatc tctgcgaggg agatgatatt 14820 

tgatcacagg cagcaacgct ctgtcatcgt tacaatcaac atgctaccct ccgcgagatc 14880 

atccgtgttt caaacccggc agcttagttg ccgttcttcc gaatagcatc ggtaacatga 14940 

gcaaagtctg ccgccttaca acggctctcc cgctgacgcc gtcccggact gatgggctgc 15000 
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ctgtatcgag tggtgatttt gtgccgagct gccggtcggg gagctgttgg ctggctggtg 15060 

gcaggatata ttgtggtgta aacaaattga cgcttagaca acttaataac acattgcgga 15120 

cgtttttaat gtactggggt .ggtttttctt ttcaccagtg agacgggcaa cagctgattg 15180 

cccttcaccg cctggccctg agagagttgc agcaagcggt ccacgctggt ttgccccagc 15240 

aggcgaaaat cctgtttgat ggtggttccg aaatcggcaa aatcccttat aaatcaaaag 15300 

aatagcccga gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga 15360 

acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg 15420 

aaccatcacc caaatcaagt tttttggggt cgaggtgccg taaagcacta aatcggaacc 15480 

ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg 15540 

aagggaagaa agcgaaagga gcgggcgcca ttcaggctgc gcaactgttg ggaagggcga 15600 

tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc tgcaaggcga 15660 

ttaagttggg taacgccagg gttttcccag tcacgacgtt gtaaaacgac ggccagtgaa 15720 

ttcgagctcg gtacccggg 15739 
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<223> n is a, c, g, or t 

<400> 4 

agcttgcatg cctgcaggtc gagtggagat gtggagtggg cgcttacaca gtacacgagg 60 

acttctagct agaaagaagg attacctcta aacaagtgta cctgtgcatt ctgggtaaac 120 

gactcatagg agagttgtaa aaaagtttcg gccggcgtat tgggtgttac ggagcattca 180 

ctaggcaacc atgcatggtt actattgtat accatcttag taggaantga tttcgaggtt 240 

tatacctacg atgaatgtgt gtcctgtagg cttgagagtt caaggaagaa acatgcaatt 300 

atctttgcga acccaggngc tggtgacgga attttcatag tcaagctatc agagtaaaga 360 

agaggagcat gtcaaagtac aattagagac aaatatatag tcgcgtggag ccaagagcgg 420 

attcctcagt ctcgtaggtc tcttgacgac cgttgatctg cttgatctcg tctcccgaaa 480 

atgaaaatag ctctgctaag ctattcttct cttcgccgga gcctgnaagg cgttactagg 540 

ttgcagtcaa tgcattaatg cattgcagat gagctgtatc tggaagaggt aaacccgaaa 600 

acgcgtttta ttcttgttga catggagcta ttaaatcact agaaggcact ctttgctgct 660 
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tggacaaatg aacgtatctt atcgagatcc tgaacaccat ttgtctcaac tccggagctg 720 

acatcgacac caacgatctt atatccagat tcgtcaagct gtttgatgat ttcagtaacg 780 

ttaagtggat cgatcccgcg gtcggcatct actctattcc tttgccctcg gacgagtgct 840 

ggggcgtcgg tttccactat cggcgagtac ttctacacag ccatcggtcc agacggccgc 900 

gcttctgcgg gcgatttgtg tacgcccgac agtcccggct ccggatcgga cgattgcgtc 960 

gcatcgaccc tgcgcccaag ctgcatcatc gaaattgccg tcaaccaagc tctgatagag 1020 

ttggtcaaga ccaatgcgga gcatatacgc ccggagccgc ggcgatcctg caagctccgg 1080 

atgcctccgc tcgaagtagc gcgtctgctg ctccatacaa gccaaccacg gcctccagaa 1140 

gaagatgttg gcgacctcgt attgggaatc cccgaacatc gcctcgctcc agtcaatgac 1200 

cgctgttatg cggccattgt ccgtcaggac attgttggag ccgaaatccg cgtgcacgag 1260 

gtgccggact tcggggcagt cctcggccca aagcatcagc tcatcgagag cctgcgcgac 1320 

ggacgcactg acggtgtcgt ccatcacagt ttgccagtga tacacatggg gatcagcaat 1380 

cgcgcatatg aaatcacgcc atgtagtgta ttgaccgatt ccttgcggtc cgaatgggcc 1440 

gaacccgctc gtctggctaa gatcggccgc agcgatcgca tccatggcct ccgcgaccgg 1500 

ctgcagaaca gcgggcagtt cggtttcagg caggtcttgc aacgtgacac cctgtgcacg 1560 

gcgggagatg caataggtca ggctctcgct gaattcccca atgtcaagca cttccggaat 1620 

cgggagcgcg gccgatgcaa agtgccgata aacataacga tctttgtaga aaccatcggc 1680 

gcagctattt acccgcagga catatccacg ccctcctaca tcgaagctga aagcacgaga 1740 

ttcttcgccc tccgagagct gcatcaggtc ggagacgctg tcgaactttt cgatcagaaa 1800 

cttctcgaca gacgtcgcgg tgagttcagg catggtgatg tctgctcaag cggggtagct 1860 

gttagtcaag ctgcgatgaa gtgggaaagc tcgaactgaa aggttcaaag gaataaggga 1920 
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tgggaaggat ggagtatgga tgtagcaaag tacttactta ggggaaataa aggttcttgg 1980 

atgggaagat gaatatactg aagatgggaa aagaaagaga aaagaaaaga gcagctggtg 2040 

gggagagcag gaaaatatgg caacaaatgt tggactgacg caacgacctt gtcaaccccg 2100 

ccgacacacc gggcggacag acggggcaaa gctgcctacc agggactgag ggacctcagc 2160 

aggtcgagtg cagagcaccg gatgggtcga ctgccagct't gtgttcccgg tctgcgccgc 2220 

tggccagctc ctgagcggcc tttccggttt catacaccgg gcaaagcagg agaggcacga 2280 

tatttggacg ccctacagat gccggatggg ccaattaggg agcttacgcg ccgggtactc 2340 

gctctaccta cttcggagaa ggtactatct cgtgaatctt ttaccagatc ggaagcaatt 2400 

ggacttctgt acctaggtta atggcatgct atttcgccga cggctataca cccctggctt 2460 

cacattctcc ttcgcttact gccggtgatt cgatgaagct ccatattctc cgatgatgca 2520 

atagattctt ggtcaacgag gggcacacca gcctttccac ttcggggcgg aggggcggcc 2580 

ggtcccggat taataatcat ccactgcacc tcagagccgc cagagctgtc tggccagtgg 2 640 

cttattactc agcccttctc tctgcgtccg tccgtctctc cgcatgccag aaagagtcac 2700 

cggtcactgt acagagctca cgagttcgtc acatttttct acaaatggtg gaggcggcgg 2760 

attttaggct caagtcatga ccctctgggt cactccagaa tcagctaggt caacgaataa 2820 

ggatgattct ataggaagat ccaggcaccg gtcaaccatg atctggacag atttgggagc 2880 

tcggtataag ctctccacct atcttattct gtatagttta ggcttaaagt ttatccagga 2940 

gatgttgctg aagtcgattt gagtccactt cctcactggt agctatacga ctttgatggt 3000 

cgttgtaggg gctgtattag gtctcgatca aacacaaata gaattaaatg gtactcgagt 3060 

ccactgaagg tggcttctcc gtcttccgta gccgtgccga aatccttaca gcttgtgttg 3120 

tgtgactttt ggttacgccg tctgactttt gtggtgagct aactagagat catgctatat 3180 
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ctcctgattt aatacaatgc tcatcataac attccacctg gaactgctag caacgtttga 3240 

cttgcattgt gcaacgccct ttgcagagct atcggatgat caatagtgcc acgttctaaa 3300 

ttcaaccaac gcaggtgccc caagccttcg acatccggat gtatttcgaa aacctcatgg 33 60 

cgattgcagt cctcagattc atgttcattc caatgctcat tggtgaataa aaggttcaca 3420 

gggaataagt tcaaactcga gatacttgag aatattgaaa gccaaaggac cctctatgct 3480 

ccaagctaga gtctcagcct ggaaagcaaa tccaaatgaa gctatgctac ctccaattcc 3540 

tcatcatctt atctataata cagagtcgaa gaatatcctc ttgacaccgc tccgtcctcc 3 600 

gacttcaata aggagcttac tcctccttga caccacccct ccagttcttc tcggcgttct 3660 

ggagggaggc cttgtcggtc ttgggctggc cctggctgag aaagctgttg gcagccttaa 3720 

agggacgctg gaggtcacca gtcgctggct tcccgaagac gtggatctta accagattcg 3780 

aaagcgcctt cagcggatga tcgactggat cagaagagcg ttggtgtact tgaagtacag 3840 

atgcatgacg gccatcatgc caacgcccat gaactggctc ttaatgagct ggcggaactg 3900 

gcccttatcg tactccatgt tggtagttgt gacaggacga ggctcctcgc cgcttccaag 3960 

cggagcaggc tcgacgtatt tcagtgtcga aagatctgat caagagacag gatgaggatc 4020 

gtttcgcatg attgaacaag atggattgca cgcaggttct ccggccgctt gggtggagag 4080 

gctattcggc tatgactggg cacaacagac aatcggctgc tctgatgccg ccgtgttccg 4140 

gctgtcagcg caggggcgcc cggttctttt tgtcaagacc gacctgtccg gtgccctgaa 4200 

tgaactgcag gacgaggcag cgcggctatc gtggctggcc acgacgggcg ttccttgcgc 4260 

agctgtgctc gacgttgtca ctgaagcggg aagggactgg ctgctattgg gcgaagtgcc 4320 

ggggcaggat ctcctgtcat ctcaccttgc tcctgccgag aaagtatcca tcatggctga 4380 

tgcaatgcgg cggctgcata cgcttgatcc ggctacctgc ccattcgacc accaagcgaa 4440 
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acatcgcatc gagcgagcac gtactcggat ggaagccggt cttgtcgatc aggatgatct 4500 

ggacgaagag catcaggggc tcgcgccagc cgaactgttc gccaggctca aggcgcgcat 4560 

gcccgacggc gaggatctcg tcgtgaccca tggcgatgcc tgcttgccga atatcatggt 4620 

ggaaaatggc cgcttttctg gattcatcga ctgtggccgg ctgggtgtgg cggaccgcta 4680 

tcaggacata gcgttggcta cccgtgatat tgctgaagag cttggcggcg aatgggctga 4740 

ccgcttcctc gtgctttacg gtatcgccgc tcccgattcg cagcgcatcg ccttctatcg 4800 

ccttcttgac gagttcttct gagcgggact ctggggttcg aaatgaccga ccaagcgacg 4860 

cccaacctgc catcacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc 4920 

ggaatcgttt tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag 4980 

ttcttcgccc accccgggct cgatcccctc gcgagttggt tcagctgctg cctgaggctg 5040 

gacgacctcg cggagttcta ccggcagtgc aaatccgtcg gcatccagga aaccagcagc 5100 

ggctatccgc gcatccatgc ccccgaactg caggagtggg gaggcacgat ggccgctttg 5160 

gtccggatct ttgtgaagga accttacttc tgtggtgtga cataattgga caaactacct 5220 

acagagattt aaagctctaa ggtaaatata aaatttttaa gtgtataatg tgttaaacta 5280 

ctgattctaa ttgtttgtgt attttagatt ccaacctatg gaactgatga atgggagcag 5340 

tggtggaatg cctttaatga ggaaaacctg ttttgctcag aagaaatgcc atctagtgat 5400 

gatgaggcta ctgctgactc tcaacattct actcctccaa aaaagaagag aaaggtagaa 5460 

gaccccaagg actttccttc agaattgcta agttttttga gtcatgctgt gtttagtaat 5520 

agaactcttg cttgctttgc tatttacacc acaaaggaaa aagctgcact gctatacaag 5580 

aaaattatgg aaaaatattc tgtaaccttt ataagtaggc ataacagtta taatcataac 5640 



WO 2004/063358 PCT7EP2004/000100 

23/358 

atactgtttt ttcttactcc acacaggcat agagtgtctg ctattaataa ctatgctcaa 5700 

aaattgtgta cctttagctt tttaatttgt aaaggggtta ataaggaata tttgatgtat 5760 

agtgccttga ctagagatca taatcagcca taccacattt gtagaggttt tacttgcttt 5820 

aaaaaacctc ccacacctcc ccctgaacct gaaacataaa atgaatgcaa ttgttgttgt 5880 

taacttgttt attgcagctt ataatggtta caaataaagc aatagcatca caaatttcac 5940 

aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca tcaatgtatc 6000 

ttatcatgtc tggatctgac gggtgcgcat gatcgtgctc ctgtcgttga ggacccggct 6060 

aggctggcgg ggttgcctta ctggttagca gaatgaatca ccgatacgcg agcgaacgtg 6120 

aagcgactgc tgctgcaaaa cgtctgcgac ctgagcaaca acatgaatgg tcttcggttt 6180 

ccgtgtttcg taaagtctgg aaacgcggaa gtcagcgctc ttccgcttcc tcgctcactg 6240 

actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa 6300 

tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc 63 60 

aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag 6420 

gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc 6480 

gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt 6540 

tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct 6600 

ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg 6660 

ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct 6720 

tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat 6780 

tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg 6840 

ctacactaga aggacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa 6900 
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aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt 6960 

ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc 7020 

tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt 7080 

atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta 7140 

aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat 7200 

ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac 7260 

tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg 7320 

ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag 7380 

tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt 7440 

aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctgcag gcatcgtggt 7500 

gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt 7560 

tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt 7620 

cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct 7680 

tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt 7740 

ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaacac gggataatac 7800 

cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa 7860 

actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa 7920 

ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca 7980 

aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct 8040 

ttttcaatat tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga 8100 

atgtatttag aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc 8160 
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tgacgtctaa gaaaccatta ttatcatgac attaacctat aaaaataggc gtatcacgag 8220 

gccctttcgt cttcaagaat tcgcggccgc aattaaccct cactaaagga tccctatagt 8280 

gagtcgtatt atgcggccgc gaattctcat gtttgaccgc ttatcatcga taagctctgc 8340 

tttttgttga cttccattgt tcattccacg gacaaaaaca gagaaaggaa acgacagagg 8400 

ccaaaaagct cgctttcagc acctgtcgtt tcctttcttt tcagagggta ttttaaataa 8460 

aaacattaag ttatgacgaa gaagaacgga aacgccttaa accggaaaat tttcataaat 8520 

agcgaaaacc cgcgaggtcg ccgccccgta acaaggcgga tcgccggaaa ggacccgcaa 8580 

atgataataa ttatcaattg catactatcg acggcactgc tgccagataa caccaccggg 8640 

gaaacattcc atcatgatgg ccgtgcggac ataggaagcc agttcatcca tcgctttctt 8700 

gtctgctgcc atttgctttg tgacatccag cgccgcacat tcagcagcgt ttttcagcgc 8760 

gttttcgatc aacgtttcaa tgttggtatc aacaccaggt ttaactttga acttatcggc 8820 

actgacggtt accttgttct gcgctggctc atcacgcagg ataccaaggc tgatgttgta 8880 

gatattggtc accggctgag ggttttcgat tgccgctgcg tggatagcac catttgcgat 8940 

caggcngtcc ttgatgaatg acactccatt gcgaataagt tcgaaggaga cggtgtcacg 9000 

aatgcgctgg tccagctcgg tcgattgcct tttgtgcagc agaggtatca atctcaacgc 9060 
caaggctcat cgaagcgcaa tattgctgct caccaaaacg cgtattgacc aggtgttcaa 9120 
cggcaaattt ctgcccttct gatgtcagaa aggcaaagtg attttctttc tggtattcag 9180 
ttgctgtgtg tcggtttcag caaaaccaag ctcgcgcaat tcggctgtgc agatttagaa 9240 
ggcagatcac cagacagcaa cggccaacgg aaaacagcgc atacagaaca tccgtcgccg 9300 
cgccgacaac gtgataattt ttatgaccca tgatttattt ccttttagac gtgagcctgt 9360 
cgcacagcaa agccgccgaa agttcctcga agctagcttc agacgtgtct agatacgtct 9420 
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gctttttgtt gacttccatt gttcattcca cggacaaaaa cagagaaagg aaacgacaga 9480 

ggccaaaaag ctcgctttca gcacctgtcg tttcctttct tttcagaggg tattttaaat 9540 

aaaaacatta agttatgacg aagaagaacg gaaacgcctt aaaccggaaa attttcataa 9600 

atagcgaaaa cccgcgaggt cgccgccccg taacaaggcg gatcgccgga aaggacccgc 9660 

aaatgataat aattatcaat tgcatactat cgacggcact gctgccagat aacaccaccg 9720 

gggaaacatt ccatcatgat ggccgtgcgg acataggaag ccagttcatc catcgctttc 9780 

ttgtctgctg ccatttgctt tgtgacatcc agcgccgcac attcagcagc gtttttcagc 9840 

gcgttttcga tcaacgtttc aatgttggta tcaacaccag gtttaacttt gaacttatcg 9900 
gcactgacgg ttaccttgtt ctgcgctggc tcatcacgca ggataccaag gctgatgttg 9960 

tagatattgg tcaccggctg agggttttcg attgccgctg cgtggatagc accatttgcg 10020 

atcaggcngt ccttgatgaa tgacactcca ttgcgaataa gttcgaagga gacggtgtca 10080 

cgaatgcgct ggtccagctc ggtcgattgc cttttgtgca gcagaggtat caatctcaac 10140 

gccaaggctc atcgaagcgc aatattgctg ctcaccaaaa cgcgtattga ccaggtgttc 10200 

aacggcaaat ttctgccctt ctgatgtcag aaaggcaaag tgattttctt tctggtattc 10260 

agttgctgtg tgtcggtttc agcaaaacca agctcgcgca attcggctgt gcagatttag 10320 

aaggcagatc accagacagc aacggccaac ggaaaacagc gcatacagaa catccgtcgc 10380 

cgcgccgaca acgtgataat ttttatgacc catgatttat ttccttttag acgtgagcct 10440 

gtcgcacagc aaagccgccg aaagttcctc gaccgatgcc cttgagagcc ttcaacccag 10500 

tcagctcctt ccggtgggcg cggggcatga ctatcgtcgc cgcacttatg actgtcttct 10560 

ttatcatgca actcgtagga caggtgccgg cagcgctctg ggtcattttc ggcgaggacc 10620 

gctttcgctg gagcgcgacg atgatcggcc tgtcgcttgc ggtattcgga atcttgcacg 10680 



WO 2004/063358 PCT/EP2004/000100 

27/358 



ccctcgctca agccttcgtc actggtcccg ccaccaaacg tttcggcgag aagcaggcca 10740 

ttatcgccgg catggcggcc gacgcgctgg gctacgtctt gctggcgttc gcgacgcgag 10800 

gctggatggc cttccccatt atgattcttc tcgcttccgg cggcatcggg atgcccgcgt 10860 

tgcaggccat gctgtccagg caggtagatg acgaccatca gggacagctt caaggatcgc 10920 

tcgcggctct taccagccta acttcgatca ttggaccgct gatcgtcacg gcgatttatg 10980 

ccgcctcggc gagcacatgg aacgggttgg catggattgt aggcgccgcc ctataccttg 11040 

tctgcctccc cgcgttgcgt cgcggtgcat ggagccgggc cacctcgacc tgaatggaag 11100 

ccggcggcac ctcgctaacg gattcaccac tccaagaatt ggagccaatc aattcttgcg 11160 

gagaactgtg aatgcgcaaa ccaacccttg gcagaacata tccatcgcgt ccgccatctc 11220 

cagcagccgc acgcggcgca tctcgggcag cgttgggtcc tgcagatccg gctgtggaat 11280 

gtgtgtcagt tagggtgtgg aaagtcccca ggctccccag caggcagaag tatgcaaagc 11340 

atgcatctca attagtcagc aaccaggtgt ggaaagtccc caggctcccc agcaggcaga 11400 

agtatgcaaa gcatgcatct caattagtca gcaaccatag tcccgcccct aactccgccc 11460 

atcccgcccc taactccgcc cagttccgcc cattctccgc cccatggctg actaattttt 11520 

tttatttatg cagaggccga ggccgcctcg gcctctgagc tattccagaa gtagtgagga 11580 

ggcttttttg gaggcctagg cttttgcaaa a 11611 



<210> 5 

<211> 21 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 
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<400> 5 

cgatgtagga gggcgtggat a 

<210> 6 

<211> 21 

<212> DNA 

<213> Artificial 



<220> 

<223> Primer 
<400> 6 

gcttctgcgg gcgatttgtg t 



<210> 7 

<211> 20 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 

<400> 7 

tgagaatatc accggaattg 



<210> 8 

<211> 21 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 

<400> 8 

agctcgacat actgttcttc c 



<210> 9 
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<211> 24 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 

^ 

<400> 9 

gtgaatggaa atcccatcgc tgtc 24 

<210> 10 

<211> 24 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 



<210> 11 

<211> 1771 

<212> DNA 

<213> Haematococcus pluvialis 



<220> 

<221> CDS 

<222> (166) . . (1155) 

<400> 11 

ggcacgagct tgcacgcaag tcagcgcgcg caagtcaaca cctgccggtc cacagcctca 60 
aataataaag agctcaagcg tttgtgcgcc tcgacgtggc cagtctgcac tgccttgaac 12 0 



<400> 



10 



agtgggtact ctaaaggcca tacc 



24 



ccgcgagtct cccgccgcac tgactgccat agcacagcta gacga atg cag eta gca 

Met Gin Leu Ala 
1 



177 
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gcg aca gta atg ttg gag cag ctt acc gga age get gag gca etc aag 225 
Ala Thr Val Met Leu Glu Gin Leu Thr Gly Ser Ala Glu Ala Leu Lys 
5 10 15 20 

gag aag gag aag gag gtt gca ggc age tct gac gtg ttg cgt aca tgg 273 
Glu Lys Glu Lys Glu Val Ala Gly Ser Ser Asp Val Leu Arg Thr Trp 
25 30 35 

gcg acc cag tac teg ctt ccg tea gaa gag tea gac gcg gec cgc ccg 321 
Ala Thr Gin Tyr Ser Leu Pro Ser Glu Glu Ser Asp Ala Ala Arg Pro 
40 45 50 

gga ctg aag aat gee tac aag cca cca cct tec gac aca aag ggc ate 369 
Gly Leu Lys Asn Ala Tyr Lys Pro Pro Pro Ser Asp Thr Lys Gly lie 
55 60 65 

aca atg gcg eta cgt gtc ate ggc tec tgg gee gca gtg ttc etc cac 417 
Thr Met Ala Leu Arg Val lie Gly Ser Trp Ala Ala Val Phe Leu His 
70 75 80 

gee att ttt caa ate aag ctt ccg acc tec ttg gac cag ctg cac tgg 465 
Ala lie Phe Gin He Lys Leu Pro Thr Ser Leu Asp Gin Leu His Trp 
85 90 95 100 

ctg ccc gtg tea gat gee aca get cag ctg gtt age ggc acg age age 513 
Leu Pro Val Ser Asp Ala Thr Ala Gin Leu Val Ser Gly Thr Ser Ser 
105 110 115 

ctg etc gac ate gtc gta gta ttc ttt gtc ctg gag ttc ctg tac aca 561 
Leu Leu Asp He Val Val Val Phe Phe Val Leu Glu Phe Leu Tyr Thr 
120 125 130 



ggc ctt ttt ate acc acg cat gat get atg cat ggc acc ate gee atg 609 
Gly Leu Phe He Thr Thr His Asp Ala Met His Gly Thr He Ala Met 
135 140 145 

aga aac agg cag ctt aat gac ttc ttg ggc aga gta tgc ate tec ttg 657 
Arg Asn Arg Gin Leu Asn Asp Phe Leu Gly Arg Val Cys He Ser Leu 
150 155 160 
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tac gcc tgg ttt gat tac aac atg ctg cac cgc aag cat tgg gag cac 705 
Tyr Ala Trp Phe Asp Tyr Asn Met Leu His Arg Lys His Trp Glu His 
165 170 175 180 

cac aac cac act ggc gag gtg ggc aag gac cct gac ttc cac agg gga 753 
His Asn His Thx Gly Glu Val Gly Lys Asp Pro Asp Phe His Arg Gly 
185 190 195 

aac cct ggc att gtg ccc tgg ttt gcc age ttc atg tec age tac atg 801 
Asn Pro Gly lie Val Pro Trp Phe Ala Ser Phe Met Ser Ser Tyr Met 
200 205 210 

teg atg tgg cag ttt gcg cgc etc gca tgg tgg acg gtg gtc atg cag 849 
Ser Met Trp Gin Phe Ala Arg Leu Ala Trp Trp Thr Val Val Met Gin 
215 220 225 

ctg ctg ggt gcg cca atg gcg aac ctg ctg gtg ttc atg gcg gcc gcg 897 
Leu Leu Gly Ala Pro Met Ala Asn Leu Leu Val Phe Met Ala Ala Ala 
230 235 240 

ccc ate ctg tec gcc ttc cgc ttg ttc tac ttt ggc acg tac atg ccc 945 
Pro He Leu Ser Ala Phe Arg Leu Phe Tyr Phe Gly Thr Tyr Met Pro 
245 250 255 260 



cac aag cct gag cct ggc gcc gcg tea ggc tct tea cca gcc gtc atg 993 
His Lys Pro Glu Pro Gly Ala Ala Ser Gly Ser Ser Pro Ala Val Met 
265 270 275 

aac tgg tgg aag teg cgc act age cag gcg tec gac ctg gtc age ttt 1041 
Asn Trp Trp Lys Ser Arg Thr Ser Gin Ala Ser Asp Leu Val Ser Phe 
280 285 290 

ctg acc tgc tac cac ttc gac ctg cac tgg gag cac cac cgc tgg ccc 1089 
Leu Thr Cys Tyr His Phe Asp Leu His Trp Glu His His Arg Trp Pro 
295 300 305 

ttc gcc ccc tgg tgg gag ctg ccc aac tgc cgc cgc ctg tct ggc cga 1137 
Phe Ala Pro Trp Trp Glu Leu Pro Asn Cys Arg Arg Leu Ser Gly Arg 
310 315 320 



ggt ctg gtt cct gcc tag ctggacacac tgcagtgggc cctgctgcca 



1185 
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Gly Leu Val Pro Ala 
325 

gctgggcatg caggttgtgg caggactggg tgaggtgaaa agctgcaggc gctgctgccg 
gacacgctgc atgggctacc ctgtgtagct gccgccacta ggggaggggg tttgtagctg 
tcgagcttgc cccatggatg aagctgtgta gtggtgcagg gagtacaccc acaggccaac 
acccttgcag gagatgtctt gcgtcgggag gagtgttggg cagtgtagat gctatgattg 
tatcttaatg ctgaagcctt taggggagcg acacttagtg ctgggcaggc aacgccctgc 
aaggtgcagg cacaagctag gctggacgag gactcggtgg caggcaggtg aagaggtgcg 
ggagggtggt gccacaccca ctgggcaaga ccatgctgca atgctggcgg tgtggcagtg 
agagctgcgt gattaactgg gctatggatt gtttgagcag tctcacttat tctttgatat 
. agatactggt caggcaggtc aggagagtga gtatgaacaa gttgagaggt ggtgcgctgc 
ccctgcgctt atgaagctgt aacaataaag tggttcaaaa aaaaaa 

<210> 12 
<211> 329 
<212> PRT 

<213> Haematococcus pluvialis 
<400> 12 

Met Gin Leu Ala Ala Thr Val Met Leu Glu Gin Leu Thr Gly Ser Ala 
15 10 15 

Glu Ala Leu Lys Glu Lys Glu Lys Glu Val Ala Gly Ser Ser Asp Val 



Leu Arg Thr Trp Ala Thr Gin Tyr Ser Leu Pro Ser Glu Glu Ser Asp 



1245 
1305 
1365 
1425 
1485 
1545 
1605 
1665 
1725 
1771 



20 



25 



30 



35 



40 



45 
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Ala Ala Arg Pro Gly Leu Lys Asn Ala Tyr Lys Pro Pro Pro Ser Asp 
50 55 60 



Thr Lys Gly He Thr Met Ala Leu Arg Val He Gly Ser Trp Ala Ala 
65 70 75 80 



Val Phe Leu His Ala He Phe Gin He Lys Leu Pro Thr Ser Leu Asp 
85 90 95 



Gin Leu His Trp Leu Pro Val Ser Asp Ala Thr Ala Gin Leu Val Ser 
100 105 110 



Gly Thr Ser Ser Leu Leu Asp He Val Val Val Phe Phe Val Leu Glu 
115 120 125 



Phe Leu Tyr Thr Gly Leu Phe He Thr Thr His Asp Ala Met His Gly 
130 135 140 



Thr He Ala Met Arg Asn Arg Gin Leu Asn Asp Phe Leu Gly Arg Val 
145 150 155 160 



Cys He Ser Leu Tyr Ala Trp Phe Asp Tyr Asn Met Leu His Arg Lys 
165 170 175 



His Trp Glu His His Asn His Thr Gly Glu Val Gly Lys Asp Pro Asp 
180 185 190 



Phe His Arg Gly Asn Pro Gly He Val Pro Trp Phe Ala Ser Phe Met 
195 200 205 
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Ser Ser Tyr Met Ser Met Trp Gin Phe Ala Arg Leu Ala Trp Trp Thr 
210 215 220 



Val Val Met Gin Leu Leu Gly Ala Pro Met Ala Asn Leu Leu Val Phe 
225 230 235 240 



Met Ala Ala Ala Pro lie Leu Ser Ala Phe Arg Leu Phe Tyr Phe Gly 
245 250 255 



Thr Tyr Met Pro His Lys Pro Glu Pro Gly Ala Ala Ser Gly Ser Ser 
260 265 270 



Pro Ala Val Met Asn Trp Trp Lys Ser Arg Thr Ser Gin Ala Ser Asp 
275 280 285 



Leu Val Ser Phe Leu Thr Cys Tyr His Phe Asp Leu His Trp Glu His 
290 295 300 



His Arg Trp Pro Phe Ala Pro Trp Trp Glu Leu Pro Asn Cys Arg Arg 
305 310 315 320 



Leu Ser Gly Arg Gly Leu Val Pro Ala 
325 



<210> 13 

<211> 1662 

<212> DNA 

<213> Haematococcus pluvialis 



<220> 
<221> 
<222> 



CDS 

(168) . . (1130) 
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<400> 13 

cggggcaact caagaaattc aacagctgca agcgcgcccc agcctcacag cgccaagtga 60 

gctatcgacg tggttgtgag cgctcgacgt ggtccactga cgggcctgtg agcctctgcg 120 

ctccgtcctc tgccaaatct cgcgtcgggg cctgcctaag tcgaaga atg cac gtc 176 

Met His Val 
1 

gca teg gca eta atg gtc gag cag'aaa ggc agt gag gca get get tec 224 
Ala Ser Ala Leu Met Val Glu Gin Lys Gly Ser Glu Ala Ala Ala Ser 
5 10 15 

age cca gac gtc ttg aga gcg tgg gcg aca cag tat cac atg cca tec 272 
Ser Pro Asp Val Leu Arg Ala Trp Ala Thr Gin Tyr His Met Pro Ser 
20 25 30 35 

gag teg tea gac gca get cgt cct gcg eta aag cac gee tac aaa cct 320, 
Glu Ser Ser Asp Ala Ala Arg Pro Ala Leu Lys His Ala Tyr Lys Pro 
40 45 50 

cca gca tct gac gec aag ggc ate acg atg gcg ctg acc ate att ggc 368 
Pro Ala Ser Asp Ala Lys Gly He Thr Met Ala Leu Thr He He Gly 
55 60 65 

acc tgg acc gca gtg ttt tta cac gca ata ttt caa ate agg eta ccg 416 
Thr Trp Thr Ala Val Phe Leu His Ala He Phe Gin He Arg Leu Pro 
70 75 80 

aca tec atg gac cag ctt cac tgg ttg cct gtg tec gaa gee aca gee 464 
Thr Ser Met Asp Gin Leu His Trp Leu Pro Val Ser Glu Ala Thr Ala 
85 90 95 

cag ctt ttg ggc gga age age age eta ctg cac ate get gca gtc ttc 512 
Gin Leu Leu Gly Gly Ser Ser Ser Leu Leu His He Ala Ala Val Phe 
100 105 110 115 

att gta ctt gag ttc ctg tac act ggt eta ttc ate acc aca cat gac 560 
He Val Leu Glu Phe Leu Tyr Thr Gly Leu Phe He Thr Thr His Asp 
120 125 130 

gca atg cat ggc acc ata get ttg agg cac agg cag etc aat gat etc 608 
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Ala Met His Gly Thr lie Ala Leu Arg His Arg Gin Leu Asn Asp Leu 
135 140 145 

ctt ggc aac ate tgc ata tea ctg tac gec tgg ttt gac tac age atg 656 
Leu Gly Asn lie Cys lie Ser Leu Tyr Ala Trp Phe Asp Tyr Ser Met 
150 155 160 

ctg cat cgc aag cac tgg gag cac cac aac cat act ggc gaa gtg ggg 704 
Leu His Arg Lys His Trp Glu His His Asn His Thr Gly Glu Val Gly 
165 170 175 

aaa gac cct gac ttc cac aag gga aat ccc ggc ctt gtc ccc tgg ttc 752 
Lys Asp Pro Asp Phe His Lys Gly Asn Pro Gly Leu Val Pro Trp Phe 
180 185 190 195 

gee age ttc atg tec age tac atg tec ctg tgg cag ttt gee egg ctg 800 
Ala Ser Phe Met Ser Ser Tyr Met Ser Leu Trp Gin Phe Ala Arg Leu 
200 205 210 

gca tgg tgg gca gtg gtg atg caa atg ctg ggg gcg ccc atg gca aat 848 
Ala Trp Trp Ala Val Val Met Gin Met Leu Gly Ala Pro Met Ala Asn 
215 220 225 

etc eta gtc ttc atg get gca gee cca ate ttg tea gca ttc cgc etc 896 
Leu Leu Val Phe Met Ala Ala Ala Pro lie Leu Ser Ala Phe Arg Leu 
230 235 240 

ttc tac ttc ggc act tac ctg cca cac aag cct gag cca ggc cct gca 944 
Phe Tyr Phe Gly Thr Tyr Leu Pro His Lys Pro Glu Pro Gly Pro Ala 
245 250 255 

gca ggc tct cag gtg atg gee tgg ttc agg gee aag aca agt gag gca 992 
Ala Gly Ser Gin Val Met Ala Trp Phe Arg Ala Lys Thr Ser Glu Ala 
260 265 270 275 

tct gat gtg atg agt ttc ctg aca tgc tac cac ttt gac ctg cac tgg 1040 
Ser Asp Val Met Ser Phe Leu Thr Cys Tyr His Phe Asp Leu His Trp 
280 285 290 



gag cac cac agg tgg ccc ttt gee ccc tgg tgg cag ctg ccc cac tgc 
Glu His His Arg Trp Pro Phe Ala Pro Trp Trp Gin Leu Pro His Cys 
295 300 305 



1088 
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cgc cgc ctg tec ggg cgt ggc ctg gtg cct gcc ttg gca tga 1130 
Arg Arg Leu Ser Gly Arg Gly Leu Val Pro Ala Leu Ala 
310 315 320 

cctggtccct ccgctggtga cccagcgtct gcacaagagt gtcatgetae agggtgctgc 1190 

ggccagtggc agcgcagtgc actctcagcc tgtatggggc taccgctgtg ccactgagca 1250 

ctgggcatgc cactgagcac tgggcgtgct actgagcaat gggcgtgcta ctgagcaatg 1310 

ggcgtgctac tgacaatggg cgtgctactg gggtctggca gtggctagga tggagtttga 1370 

tgcattcagt agcggtggcc aacgtcatgt ggatggtgga agtgctgagg ggtttaggca 1430 

geeggcattt gagagggcta agttataaat cgcatgctgc tcatgcgcac atatctgeae 1490 

acagecaggg aaatcccttc gagagtgatt atgggacact tgtattggtt tegtgetatt 1550 

gttttattca gcagcagtac ttagtgaggg tgagagcagg gtggtgagag tggagtgagt 1610 

gagtatgaac ctggtcagcg aggtgaacag cctgtaatga atgactctgt ct 1662 



<210> 14 
<211> 320 
<212> PRT 

<213> Haematococcus pluvialis 
<400> 14 

Met His Val Ala Ser Ala Leu Met Val Glu Gin Lys Gly Ser Glu Ala 
15 10 15 



Ala Ala Ser Ser Pro Asp Val Leu Arg Ala Trp Ala Thr Gin Tyr His 
20 25 30 



Met Pro Ser Glu Ser Ser Asp Ala Ala Arg Pro Ala Leu Lys His Ala 
35 40 45 
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Tyr Lys Pro Pro Ala Ser Asp Ala Lys Gly He Thr Met Ala Leu Thr 
50 55 60 



He He Gly Thr Trp Thr Ala Val Phe Leu His Ala lie Phe Gin He 
65 70 75 80 



Arg Leu Pro Thr Ser Met Asp Gin Leu His Trp Leu Pro Val Ser Glu 
85 90 95 



Ala Thr Ala Gin Leu Leu Gly Gly Ser Ser Ser Leu Leu His He Ala 
100 105 HO 



Ala Val Phe He Val Leu Glu Phe Leu Tyr Thr Gly Leu Phe He Thr 
115 120 125 



Thr His Asp Ala Met His Gly Thr He Ala Leu Arg His Arg Gin Leu 
130 135 140 



Asn Asp Leu Leu Gly Asn He Cys He Ser Leu Tyr Ala Trp Phe Asp 
145 150 155 160 



Tyr Ser Met Leu His Arg Lys His Trp Glu His His Asn His Thr Gly 
165 . 170 175 



Glu Val Gly Lys Asp Pro Asp Phe His Lys Gly Asn Pro Gly Leu Val 
180 185 190 



Pro Trp Phe Ala Ser Phe Met Ser Ser Tyr Met Ser Leu Trp Gin Phe 
195 200 205 



Ala Arg Leu Ala Trp Trp Ala Val Val Met Gin Met Leu Gly Ala Pro 
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210 215 220 



Met Ala Asn Leu Leu Val Phe Met Ala Ala Ala Pro lie Leu Ser Ala 
225 230 235 240 



Phe Arg Leu Phe Tyr Phe Gly Thr Tyr Leu Pro His Lys Pro Glu Pro 
245 250 255 



Gly Pro Ala Ala Gly Ser Gin Val Met Ala Trp Phe Arg Ala Lys Thr 
260 265 270 



Ser Glu Ala Ser Asp Val Met Ser Phe Leu Thr Cys Tyr His Phe Asp 
275 280 285 



Leu His Trp Glu His His Arg Trp Pro Phe Ala Pro Trp Trp Gin Leu 
290 295 300 



Pro His Cys Arg Arg Leu Ser Gly Arg Gly Leu Val Pro Ala Leu Ala 
305 310 315 320 



<210> 15 

<211> 729 

<212> DNA 

<213> Agrobacterium aurantiacum 



<220> 

<221> CDS 

<222> (1)..(729) 

<400> 15 

atg age gca cat gec ctg ccc aag gca gat ctg acc gec acc age ctg 

Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu 
15 10 15 
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ate gtc teg ggc ggc ate ate gee get tgg ctg gec ctg cat gtg cat 96 

He Val Ser Gly Gly He He Ala Ala Trp Leu Ala Leu His Val His 
20 25 30 

gcg ctg tgg ttt ctg gac gca gcg gcg cat ccc ate ctg gcg ate gca 144 
Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro He Leu Ala He Ala 
35 40 45 

aat ttc ctg ggg ctg acc tgg ctg teg gtc gga ttg ttc ate ate gcg 192 
Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe He He Ala 
50 55 60 

cat gac gcg atg cac ggg teg gtg gtg ccg ggg cgt ccg cgc gee aat 240 
His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 
65 70 75 80 

gcg gcg atg ggc cag ctt gtc ctg tgg ctg tat gec gga ttt teg tgg 288 
Ala Ala Met Gly Gin Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp 
85 90 95 

cgc aag atg ate gtc aag cac atg gee cat cac cgc cat gec gga acc 33 6 

Arg Lys Met He Val Lys His Met Ala His His Arg His Ala Gly Thr 
100 105 110 

gac gac gac ccc gat ttc gac cat ggc ggc ccg gtc cgc tgg tac gec 384 
Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala 
115 120 125 

cgc ttc ate ggc acc tat ttc ggc tgg cgc gag ggg ctg ctg ctg ccc 432 
Arg Phe He Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
130 135 140 

gtc ate gtg acg gtc tat gcg ctg ate ctt ggg gat cgc tgg atg tac 480 
Val He Val Thr Val Tyr Ala Leu He Leu Gly Asp Arg Trp Met Tyr 
145 150 155 160 

gtg gtc ttc tgg ccg ctg ccg teg ate ctg gcg teg ate cag ctg ttc 528 
Val Val Phe Trp Pro Leu Pro Ser He. Leu Ala Ser He Gin Leu Phe 
165 170 175 



gtg ttc ggc acc tgg ctg ccg cac cgc ccc ggc cac gac gcg ttc ccg 
Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 



576 
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180 185 190 

gac cgc cac aat gcg egg teg teg egg ate age gac ccc gtg teg ctg 624 
Asp Arg His Asn Ala Arg Ser Ser Arg lie Ser Asp Pro Val Ser Leu 
195 200 205 

ctg acc tgc ttt cac ttt ggc ggt tat cat cac gaa cac cac ctg cac 672 
Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
210 215 220 

ccg acg gtg ccg tgg tgg cgc ctg ccc age acc cgc acc aag ggg gac 720 
Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp 
225 230 235 240 

acc gca tga 729 
Thr Ala 



<210> 16 
<211> 242 
<212> PRT 

<213> Agrobacterium aurantiacum 
<400> 16 

Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu 
15 10 15 



lie Val Ser Gly Gly lie He Ala Ala Trp Leu Ala Leu His Val His 
20 25 30 



Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro He Leu Ala He Ala 
35 40 45 



Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe He He Ala 
50 55 60 
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His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 
65 70 75 80 



Ala Ala Met Gly Gin Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp 
85 90 95 



Arg Lys Met He Val Lys His Met Ala His His Arg His Ala Gly Thr 
100 105 110 



Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala 
115 120 125 



Arg Phe He Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
130 135 140 



Val He Val Thr Val Tyr Ala Leu He Leu Gly Asp Arg Trp Met Tyr 
145 150 155 160 



Val Val Phe Trp Pro Leu Pro Ser He Leu Ala Ser He Gin Leu Phe 
165 170 175 



Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 
180 185 190 



Asp Arg His Asn Ala Arg Ser Ser Arg He Ser Asp Pro Val Ser Leu 
195 200 205 



Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
210 215 220 



Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp 
225 230 235 240 
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Thr Ala 



<210> 17 

<211> 1631 

<212> DNA 

<213> Alcaligenes sp. 



<220> 

<221> CDS 

<222> (99).. (827) 

<400> 17 

ctgcaggccg ggcccggtgg ccaatggtcg caaccggcag gactggaaca ggacggcggg 60 

ccggtctagg ctgtcgccct acgcagcagg agtttcgg atg tec gga egg aag cct 116 

Met Ser Gly Arg Lys Pro 
1 5 

ggc aca act ggc gac acg ate gtc aat etc ggt ctg acc gee gcg ate 164 
Gly Thr Thr Gly Asp Thr He Val Asn Leu Gly Leu Thr Ala Ala He 
10 15 20 

ctg ctg tgc tgg ctg gtc ctg cac gee ttt acg eta tgg ttg eta gat 212 
Leu Leu Cys Trp Leu Val Leu His Ala Phe Thr Leu Trp Leu Leu Asp 
25 30 35 

gcg gec gcg cat ccg ctg ctt gee gtg ctg tgc ctg get ggg ctg acc 260 
Ala Ala Ala His Pro Leu Leu Ala Val Leu Cys Leu Ala Gly Leu Thr 
40 45 50 

tgg ctg teg gtc ggg ctg ttc ate ate gcg cat gac gca atg cac ggg 308 
Trp Leu Ser Val Gly Leu Phe He He Ala His Asp Ala Met His Gly 
55 60 65 70 

tec gtg gtg ccg ggg egg ccg cgc gec aat gcg gcg ate ggg caa ctg 356 

Ser Val Val Pro Gly Arg Pro Arg Ala Asn Ala Ala He Gly Gin Leu 
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75 80 85 

gcg ctg tgg etc tat gcg ggg ttc teg tgg ccc aag ctg ate gee aag 404 
Ala Leu Trp Leu Tyr Ala Gly Phe Ser Trp Pro Lys Leu He Ala Lys 
90 95 100 

cac atg acg cat cac egg cac gec ggc ace gac aac gat ccc gat ttc 452 
His Met Thr His His Arg His Ala Gly Thr Asp Asn Asp Pro Asp Phe 
105 110 115 

ggt cac gga ggg ccc gtg cgc tgg tac ggc age ttc gtc tec ace tat 500 
Gly His Gly Gly Pro Val Arg Trp Tyr Gly Ser Phe Val Ser Thr Tyr 
120 125 130 

ttc ggc tgg cga gag gga ctg ctg eta ccg gtg ate gtc ace ace tat 548 
Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro Val He Val Thr Thr Tyr 
135 140 145 150 

gcg ctg ate ctg ggc gat cgc tgg atg tat gtc ate ttc tgg ccg gtc 596 
Ala Leu He Leu Gly Asp Arg Trp Met Tyr Val He Phe Trp Pro Val 
155 160 165 

ccg gee gtt ctg gcg teg ate cag att ttc gtc ttc gga act tgg ctg 644 
Pro Ala Val Leu Ala Ser He Gin He Phe Val Phe Gly Thr Trp Leu 
170 175 180 

ccc cac cgc ccg gga cat gac gat ttt ccc gac egg cac aac gcg agg 692 
Pro His Arg Pro Gly His Asp Asp Phe Pro Asp Arg His Asn Ala Arg 
185 190 195 

teg ace ggc ate ggc gac ccg ttg tea eta ctg acc tgc ttc cat ttc 740 

Ser Thr Gly He Gly Asp Pro Leu Ser Leu Leu Thr Cys Phe His Phe 
200 205 210 

ggc ggc tat cac cac gaa cat cac ctg cat ccg cat gtg ccg tgg tgg 788 
Gly Gly Tyr His His Glu His His Leu His Pro His Val Pro Trp Trp 
215 220 225 230 



cgc ctg cct cgt aca cgc aag acc gga ggc cgc gca tga cgcaattcct 
Arg Leu Pro Arg Thr Arg Lys Thr Gly Gly Arg Ala 
235 240 



837 
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cattgtcgtg gcgacagtcc tcgtgatgga gctgaccgcc tattccgtcc accgctggat 897 

tatgcacggc cccctaggct ggggctggca caagtcccat cacgaagagc acgaccacgc 957 

. gttggagaag aacgacctct acggcgtcgt cttcgcggtg ctggcgacga tcctcttcac 1017 

cgtgggcgcc tattggtggc cggtgctgtg gtggatcgcc ctgggcatga cggtctatgg 1077 

gttgatctat ttcatcctgc acgacgggct tgtgcatcaa cgctggccgt ttcggtatat 1137 

tccgcggcgg ggctatttcc gcaggctcta ccaagctcat cgcctgcacc acgcggtcga 1197 

ggggcgggac cactgcgtca gcttcggctt catctatgcc ccacccgtgg acaagctgaa' 1257 

gcaggatctg aagcggtcgg gtgtcctgcg cccccaggac gagcgtccgt cgtgatctct 1317 

gatcccggcg tggccgcatg aaatccgacg tgctgctggc aggggccggc cttgccaacg 1377 

gactgatcgc gctggcgatc cgcaaggcgc ggcccgacct tcgcgtgctg ctgctggacc 1437 

gtgcggcggg cgcctcggac gggcatactt ggtcctgcca cgacaccgat ttggcgccgc 1497 

actggctgga ccgcctgaag ccgatcaggc gtggcgactg gcccgatcag gaggtgcggt 1557 

tcccagacca ttcgcgaagg ctccgggccg gatatggctc gatcgacggg cgggggctga 1617 

tgcgtgcggt gacc 1631 

<210> 18 
<211> 242 
<212> PRT 

<213> Alcaligenes sp. 
<400> 18 

Met Ser Gly Arg Lys Pro Gly Thr Thr Gly Asp Thx lie Val Asn Leu 
15 10 15 
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Gly Leu Thr Ala Ala He Leu Leu Cys Trp Leu Val Leu His Ala Phe 
20 25 30 



Thr Leu Trp Leu Leu Asp Ala Ala Ala His Pro Leu Leu Ala Val Leu 
35 40 45 



Cys Leu Ala Gly Leu Thr Trp Leu Ser Val Gly Leu Phe He He Ala 
50 55 60 



His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 
65 70 75 80 



Ala Ala He Gly Gin Leu Ala Leu Trp Leu Tyr Ala Gly Phe Ser Trp 
85 90 95 



Pro Lys Leu He Ala Lys His Met Thr His His Arg His Ala Gly Thr 
100 105 110 



Asp Asn Asp Pro Asp Phe Gly His Gly Gly Pro Val Arg Trp Tyr Gly 
115 120 125 



Ser Phe Val Ser Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
130 135 140 



Val He Val Thr Thr Tyr Ala Leu He Leu Gly Asp Arg Trp Met Tyr 
145 150 155 160 



Val He Phe Trp Pro Val Pro Ala Val Leu Ala Ser He Gin He Phe 
165 170 175 



Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Asp Phe Pro 
180 185 190 
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Asp Arg His Asn Ala Arg Ser Thr Gly He Gly Asp Pro Leu Ser Leu 
195 200 205 



Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
210 215 220 



Pro His Val Pro Trp Trp Arg Leu Pro Arg Thr Arg Lys Thr Gly Gly 
225 230 235 240 



Arg Ala 



<210> 19 

<211> 729 

<212> DNA 

<213> Paracoccus marcusii 



<220> 

<221> CDS 

<222> (1)..(729) 



48 



96 



<400> 19 

atg age gca cat gec ctg ccc aag gca gat ctg acc gec aca age ctg 
Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu 
15 10 15 

ate gtc teg ggc ggc ate ate gee gca tgg ctg gec ctg cat gtg cat 
He Val Ser Gly Gly He He Ala Ala Trp Leu Ala Leu His Val His 
20 25 30 

gcg ctg tgg ttt ctg gac gcg gcg gec cat ccc ate ctg gcg gtc gcg 144 
Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro He Leu Ala Val Ala 
35 40 45 



aat ttc ctg ggg ctg acc tgg ctg teg gtc gga ttg ttc ate ate gcg 
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Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe lie He Ala 
50 55 60 

cat gac gcg atg cac ggg teg gtc gtg ccg ggg cgt ccg cgc gec aat 240 
His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 
65 70 75 80 

gcg gcg atg ggc cag ctt gtc ctg tgg ctg tat gec gga ttt teg tgg 288 
Ala Ala Met Gly Gin Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp 
85 90 95 

cgc aag atg ate gtc aag cac atg gec cat cac cgc cat gee gga ace 336 
Arg Lys Met He Val Lys His Met Ala His His Arg His Ala Gly Thr 
100 105 . 110 

gac gac gac cca gat ttc gac cat ggc ggc ccg gtc cgc tgg tac gec 3 84 

Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala 
115 120 125 

cgc ttc ate ggc ace tat ttc ggc tgg cgc gag ggg ctg ctg ctg ccc 432 
Arg Phe He Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
130 135 140 

gtc ate gtg acg gtc tat gcg ctg ate ctg ggg gat cgc tgg atg tac 480 
Val He Val Thr Val Tyr Ala Leu He Leu Gly Asp Arg Trp Met Tyr 
145 150 155 160 

gtg gtc ttc tgg ccg ttg ccg teg ate ctg gcg teg ate cag ctg ttc 528 
Val Val Phe Trp Pro Leu Pro Ser He Leu Ala Ser He Gin Leu Phe 
165 170 175 

gtg ttc ggc act tgg ctg ccg cac cgc ccc ggc cac gac gcg ttc ccg 576 
Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 
180 185 190 

gac cgc cat aat gcg egg teg teg egg ate age gac cct gtg teg ctg 624 
Asp Arg His Asn Ala Arg Ser Ser Arg He Ser Asp Pro Val Ser Leu 
195 200 205 



ctg ace tgc ttt cat ttt ggc ggt tat cat cac gaa cac cac ctg cac 
Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
210 215 220 
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ccg acg gtg ccg tgg tgg cgc ctg ccc age acc cgc acc aag ggg gac 
Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp 
225 230 235 240 

acc gca tga 
Thr Ala 



720 



<210> 20 
<211> 242 
<212> PRT 

<213> Paracoccus marcusii 
<400> 20 

Met Ser Ala His Ala l»eu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu 
15 10 15 



He Val Ser Gly Gly He He Ala Ala Trp Leu Ala Leu His Val His 
20 25 30 



Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro He Leu Ala Val Ala 
35 40 45 



Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe He He Ala 
50 55 60 



His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 
65 70 75 80 



Ala Ala Met Gly Gin Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp 
85 90 95 



729 



Arg Lys Met He Val Lys His Met Ala His His Arg His Ala Gly Thr 
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100 105 HO 



Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala 
115 120 125 



Arg Phe lie Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
130 135 140 



Val lie Val Thr Val Tyr Ala Leu He Leu Gly Asp Arg Trp Met Tyr 
145 150 155 160 



Val Val Phe Trp Pro Leu Pro Ser He Leu Ala Ser He Gin Leu Phe 
165 170 175 



Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 
180 185 190 



Asp Arg His Asn Ala Arg Ser Ser Arg lie Ser Asp Pro Val Ser Leu 
195 200 205 



Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
210 215 220 



Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp 
225 230 235 240 



Thr Ala 



<210> 21 
<211> 1629 
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<212> DNA 

<213> Synechocystis sp. 



<220> 

<221> CDS 

<222> (1)..(1629) 



<400> 21 

atg ate acc acc gat gtt gtc att att ggg gcg ggg cac aat ggc tta 48 
Met lie Thr Thr Asp Val Val He He Gly Ala Gly His Asn Gly Leu 
1.5 10 15 

gtc tgt gca gec tat ttg etc caa egg ggc ttg ggg gtg acg tta eta 96 
Val Cys Ala Ala Tyr Leu Leu Gin Arg Gly Leu Gly Val Thr Leu Leu 
20 25 30 



gaa aag egg gaa gta cca ggg ggg gcg gee acc aca gaa get etc atg 144 
Glu Lys Arg Glu Val Pro Gly Gly Ala Ala Thr Thr Glu Ala Leu Met 
35 40 45 

« 

ccg gag eta tec ccc cag ttt cgc ttt aac cgc tgt gec att gac cac 192 
Pro Glu Leu Ser Pro Gin Phe Arg Phe Asn Arg Cys Ala He Asp His 
50 55 60 



gaa ttt ate ttt ctg ggg ccg gtg ttg cag gag eta aat tta gec cag 240 
Glu Phe He Phe Leu Gly Pro Val Leu Gin Glu Leu Asn Leu Ala Gin 
65 70 75 80 



tat ggt ttg gaa tat tta ttt tgt gac ccc agt gtt ttt tgt ccg ggg 288 
Tyr Gly Leu Glu Tyr Leu Phe Cys Asp Pro Ser Val Phe Cys Pro Gly 
85 90 95 

ctg gat ggc caa get ttt atg age tac cgt tec eta gaa aaa acc tgt 336 
Leu Asp Gly Gin Ala Phe Met Ser Tyr Arg Ser Leu Glu Lys Thr Cys 
100 105 110 



gee cac att gee acc tat age ccc cga gat gcg gaa aaa tat egg caa 384 
Ala His He Ala Thr Tyr Ser Pro Arg Asp Ala Glu Lys Tyr Arg Gin 
115 120 125 



ttt gtc aat tat tgg acg gat ttg etc aac get gtc cag cct get ttt 
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Phe Val Asn Tyr Trp Thr Asp Leu Leu Asn Ala Val Gin Pro Ala Phe 
130 135 140 

aat get ccg ccc cag get tta eta gat tta gee ctg aac tat ggt tgg 480 
Asn Ala Pro Pro Gin Ala Leu Leu Asp Leu Ala Leu Asn Tyr Gly Trp 
•145 150 155 160 

gaa aac tta aaa tec gtg ctg gcg ate gee ggg teg aaa ace aag gcg 528 
Glu Asn Leu Lys Ser Val Leu Ala lie Ala Gly Ser Lys Thr Lys Ala 
165 170 175 

ttg gat ttt ate cgc act atg ate ggc tec ccg gaa gat gtg etc aat 576 
Leu Asp Phe lie Arg Thr Met lie Gly Ser Pro Glu Asp Val Leu Asn 
180 ' 185 190 

gaa tgg ttc gac age gaa egg gtt aaa get cct tta get aga eta tgt 624 
Glu Trp Phe Asp Ser Glu Arg Val Lys Ala Pro Leu Ala Arg Leu Cys 
195 200 205 

teg gaa att ggc get ccc cca tec caa aag ggt agt age tec ggc atg 672 
Ser Glu lie Gly Ala Pro Pro Ser Gin Lys Gly Ser Ser Ser Gly Met 
210 215 220 

atg atg gtg gee atg egg cat ttg gag gga att gee aga cca aaa gga 720 
Met Met Val Ala Met Arg His Leu Glu Gly lie Ala Arg Pro Lys Gly 
225 230 235 240 

ggc act gga gee etc aca gaa gee ttg gtg aag tta gtg caa gee caa 768 
Gly Thr Gly Ala Leu Thr Glu Ala Leu Val Lys Leu Val Gin Ala Gin 
245 250 255 

ggg gga aaa ate etc act gac caa ace gtc aaa egg gta ttg gtg gaa 816 
Gly Gly Lys He Leu Thr Asp Gin Thr Val Lys Arg Val Leu Val Glu 
260 265 270 

aac aac cag gcg ate ggg gtg gag gta get aac gga gaa cag tac egg 864 
Asn Asn Gin Ala He Gly Val Glu Val Ala Asn Gly Glu Gin Tyr Arg 
275 280 285 



gee aaa aaa ggc gtg att tct aac ate gat gee cgc cgt tta ttt ttg 
Ala Lys Lys Gly Val He Ser Asn He Asp Ala Arg Arg Leu Phe Leu 
290 295 300 
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caa ttg gtg gaa ccg ggg gcc eta gec aag gtg aat caa aac eta ggg 960 
Gin Leu Val Glu Pro Gly Ala Leu Ala Lys Val Asn Gin Asn Leu Gly 
305 310 315 320 

gaa cga ctg gaa egg cgc act gtg aac aat aac gaa gcc att tta aaa 1008 
Glu Arg Leu Glu Arg Arg Thr Val Asn Asn Asn Glu Ala lie Leu Lys 
325 330 335 

ate gat tgt gcc etc tec ggt tta ccc cac ttc act gcc atg gcc ggg 1056 
He Asp Cys Ala Leu Ser Gly Leu Pro His Phe Thr Ala Met Ala Gly 
340 345 350 

ccg gag gat eta acg gga act att ttg att gcc gac teg gta cgc cat 1104 
Pro Glu Asp Leu Thr Gly Thr He Leu He Ala Asp Ser Val Arg His 
355 360 365 

gtc gag gaa gcc cac gcc etc att gcc ttg ggg caa att ccc gat get 1152 
Val Glu Glu Ala His Ala Leu He Ala Leu Gly Gin He Pro Asp Ala 
370 375 380 

aat ccg tct tta tat ttg gat att ccc act gta ttg gac ccc ace atg 1200 
Asn Pro Ser Leu Tyr Leu Asp He Pro Thr Val Leu Asp Pro Thr Met 
385 390 395 400 

gcc ccc cct ggg cag cac ace etc tgg ate gaa ttt ttt gcc ccc tac 1248 
Ala Pro Pro Gly Gin His Thr Leu Trp He Glu Phe Phe Ala Pro Tyr 
405 410 415 

cgc ate gcc ggg ttg gaa ggg aca ggg tta atg ggc aca ggt tgg acc 1296 
Arg He Ala Gly Leu Glu Gly Thr Gly Leu Met Gly Thr Gly Trp Thr 
420 425 430 

gat gag tta aag gaa aaa gtg gcg gat egg gtg att gat aaa tta acg 1344 
Asp Glu Leu Lys Glu Lys Val Ala Asp Arg Val He Asp Lys Leu Thr 
435 440 445 

gac tat gcc cct aac eta aaa tct ctg ate att ggt cgc cga gtg gaa 1392 
Asp Tyr Ala Pro Asn Leu Lys Ser Leu He He Gly Arg Arg Val Glu 
450 455 460 



agt ccc gcc gaa ctg gcc caa egg ctg gga agt tac aac ggc aat gtc 



1440 
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Ser Pro Ala Glu Leu Ala Gin Arg Leu Gly Ser Tyr Asn Gly Asn Val 
465 470 475 480 

tat cat ctg gat atg agt ttg gac caa atg atg ttc etc egg cct eta 1488 
Tyr His Leu Asp Met Ser Leu Asp Gin Met Met Phe Leu Arg Pro Leu 
485 490 495 

ccg gaa att gec aac tac caa acc ccc ate aaa aat ctt tac tta aca 1536 
Pro Glu lie Ala Asn Tyr Gin Thr Pro lie Lys Asn Leu Tyr Leu Thr 
500 505 510 

ggg gcg ggt acc cat ccc ggt ggc tec ata tea ggt atg ccc ggt aga 1584 
Gly Ala Gly Thr His Pro Gly Gly Ser He Ser Gly Met Pro Gly Arg 
515 520 525 

aat tgc get egg gtc ttt tta aaa caa caa cgt cgt ttt tgg taa 1629 
Asn Cys Ala Arg Val Phe Leu Lys Gin Gin Arg Arg Phe Trp 
530 535 540 



<210> 22 
<211> 542 
<212> PRT 

<213> Synechocystis sp. 
<400> 22 

Met He Thr Thr Asp Val Val He He Gly Ala Gly His Asn Gly Leu 
15 10 15 

Val Cys Ala Ala Tyr Leu Leu Gin Arg Gly Leu Gly Val Thr Leu Leu 
20 25 30 

Glu Lys Arg Glu Val Pro Gly Gly Ala Ala Thr Thr Glu Ala Leu Met 
35 40 45 



Pro Glu Leu Ser Pro Gin Phe Arg Phe Asn Arg Cys Ala He Asp His 
50 55 60 



WO 2004/063358 



55/358 



PCT/EP2004/000100 



Glu Phe lie Phe Leu Gly Pro Val Leu Gin Glu Leu Asn Leu Ala Gin 
65 70 75 80 



Tyr Gly Leu Glu Tyr Leu Phe Cys Asp Pro Ser Val Phe Cys Pro Gly 
85 90 95 



Leu Asp Gly Gin Ala Phe Met Ser Tyr Arg Ser Leu Glu Lys Thr Cys 
100 105 110 



Ala His lie Ala Thr Tyr Ser Pro Arg Asp Ala Glu Lys Tyr Arg Gin 
115 120 125 



Phe Val Asn Tyr Trp Thr Asp Leu Leu Asn Ala Val Gin Pro Ala Phe 
130 135 140 



Asn Ala Pro Pro Gin Ala Leu Leu Asp Leu Ala Leu Asn Tyr Gly Trp 
145 150 155 160 



Glu Asn Leu Lys Ser Val Leu Ala He Ala Gly Ser Lys Thr Lys Ala 
165 170 175 



Leu Asp Phe lie Arg Thr Met He Gly Ser Pro Glu Asp Val Leu Asn 
180 185 190 



Glu Trp Phe Asp Ser Glu Arg Val Lys Ala Pro Leu Ala Arg Leu Cys 
195 200 205 



Ser Glu He Gly Ala Pro Pro Ser Gin Lys Gly Ser Ser Ser Gly Met 
210 215 220 



Met Met Val Ala Met Arg His Leu Glu Gly He Ala Arg Pro Lys Gly 
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225 230 235 240 



Gly Thr Gly Ala Leu Thr Glu Ala Leu Val Lys Leu Val Gin Ala Gin 
245 250 255 



Gly Gly Lys lie Leu Thr Asp Gin Thr Val Lys Arg Val Leu Val Glu 
260 265 270 



Asn Asn Gin Ala lie Gly Val Glu Val Ala Asn Gly Glu Gin Tyr Arg 
275 280 285 



Ala Lys Lys Gly Val He Ser Asn He Asp Ala Arg Arg Leu Phe Leu 
290 295 300 



Gin Leu Val Glu Pro Gly Ala Leu Ala Lys Val Asn Gin Asn Leu Gly 
305 310 315 320 



Glu Arg Leu Glu Arg Arg Thr Val Asn Asn Asn Glu Ala He Leu Lys 
325 330 335 



He Asp Cys Ala Leu Ser Gly Leu Pro His Phe Thr Ala Met Ala Gly 
340 345 350 



Pro Glu Asp Leu Thr Gly Thr He Leu He Ala Asp Ser Val Arg His 
355 360 365 



Val Glu Glu Ala His Ala Leu He Ala Leu Gly Gin He Pro Asp Ala 
370 375 380 



Asn Pro Ser Leu Tyr Leu Asp He Pro Thr Val Leu Asp Pro Thr Met 
385 390 395 400 
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Ala Pro Pro Gly Gin His Thr Leu Trp lie Glu Phe Phe Ala Pro Tyr 
405 410 415 



Arg lie Ala Gly Leu Glu Gly Thr Gly Leu Met Gly Thr Gly Trp Thr 
420 425 430 



Asp Glu Leu Lys Glu Lys Val Ala Asp Arg Val lie Asp Lys Leu Thr 
435 440 445 



Asp Tyr Ala Pro Asn Leu Lys Ser Leu lie lie Gly Arg Arg Val Glu 
450 455 460 



Ser Pro Ala Glu Leu Ala Gin Arg Leu Gly Ser Tyr Asn Gly Asn Val 
465 470 475 480 



Tyr His Leu Asp Met Ser Leu Asp Gin Met Met Phe Leu Arg Pro Leu 
485 490 495 



Pro Glu lie Ala Asn Tyr Gin Thr Pro He Lys Asn Leu Tyr Leu Thr 
500 505 510 



Gly Ala Gly Thr His Pro Gly Gly Ser He Ser Gly Met Pro Gly Arg 
515 520 525 



Asn Cys Ala Arg Val Phe Leu Lys Gin Gin Arg Arg Phe Trp 
530 535 540 



<210> 23 

<211> 776 

<212> DNA 

<213> Bradyrhizobium sp. 
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<220> 

<221> CDS 

<222> (1)..(774) 



<400> 23 

atg cat gca gca acc gcc aag get act gag ttc ggg gec tct egg cgc 48 
Met His Ala Ala Thr Ala Lys Ala Thr Glu Phe Gly Ala Ser Arg Arg 
15 10 15 



gac gat gcg agg cag cgc cgc gtc ggt etc acg ctg gcc gcg gtc ate 96 
Asp Asp Ala Arg Gin Arg Arg Val Gly Leu Thr Leu Ala Ala Val He 
20 25 30 



ate gcc gcc tgg ctg gtg ctg cat gtc ggt ctg atg ttc ttc tgg ccg 144 
He Ala Ala Trp Leu Val Leu His Val Gly Leu Met Phe Phe Trp Pro 
35 40 45 

ctg acc ctt cac age ctg ctg ccg get ttg cct ctg gtg gtg ctg cag 192 
Leu Thr Leu His Ser Leu Leu Pro Ala Leu Pro Leu Val Val Leu Gin 
50 55 60 



acc tgg etc tat gta ggc ctg ttc ate ate gcg cat gac tgc atg cac 240 
Thr Trp Leu Tyr Val Gly Leu Phe He He Ala His Asp Cys Met His 
65 70 75 m 80 



ggc teg ctg gtg ccg ttc aag ccg cag gtc aac cgc cgt ate gga cag 288 
Gly Ser Leu Val Pro Phe Lys Pro Gin Val Asn Arg Arg He Gly Gin 
85 90 95 

etc tgc ctg ttc etc tat gcc ggg ttc tec ttc gac get etc aat gtc 336 
Leu Cys Leu Phe Leu Tyr Ala Gly Phe Ser Phe Asp Ala Leu Asn Val 
100 105 110 

gag cac cac aag cat cac cgc cat ccc ggc acg gcc gag gat ccc gat 384 
Glu His His Lys His His Arg His Pro Gly Thr Ala Glu Asp Pro Asp 
115 120 125 

ttc gac gag gtg ccg ccg cac ggc ttc tgg cac tgg ttc gcc age ttt 432 
Phe Asp Glu Val Pro Pro His Gly Phe Trp His Trp Phe Ala Ser Phe 
130 135 140 
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ttc ctg cac tat ttc ggc tgg aag cag gtc gcg ate ate gca gec gtc 480 
Phe Leu His Tyr Phe Gly Trp Lys Gin Val Ala lie lie Ala Ala Val 
145 150 155 160 

teg ctg gtt tat cag etc gtc ttc gec gtt ccc ttg cag aac ate ctg 528 
Ser Leu Val Tyr Gin Leu Val Phe Ala Val Pro Leu Gin Asn lie Leu 
165 170 175 

ctg ttc tgg gcg ctg ccc ggg ctg ctg teg gcg ctg cag ctg ttc ace 576 
Leu Phe Trp Ala Leu Pro Gly Leu Leu Ser Ala Leu Gin Leu Phe Thr 
180 185 190 

ttc ggc acc tat ctg ccg cac aag ccg gee acg cag ccc ttc gee gat 624 
Phe Gly Thr Tyr Leu Pro His Lys Pro Ala Thr Gin Pro Phe Ala Asp 
195 200 205 

cgc cac aac gcg egg acg age gaa ttt ccc gcg tgg ctg teg ctg ctg 672 
Arg His Asn Ala Arg Thr Ser Glu Phe Pro Ala Trp Leu Ser Leu Leu 
210 215 220 

acc tgc ttc cac ttc ggc ttt cat cac gag cat cat ctg cat ccc gat 720 
Thr Cys Phe His Phe Gly Phe His His Glu His His Leu His Pro Asp 
225 230 235 240 

gcg ccg tgg tgg egg ctg ccg gag ate aag egg egg gec ctg gaa agg 768 
Ala Pro Trp Trp Arg Leu Pro Glu lie Lys Arg Arg Ala Leu Glu Arg 
245 250 255 

cgt gac ta 776 
Arg Asp 



<210> 24 

<211> 258 

<212> PRT 

<213> Bradyrhizobium sp. 

<400> 24 



Met His Ala Ala Thr Ala Lys Ala Thr Glu Phe Gly Ala Ser Arg Arg 
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15 10 15 



Asp Asp Ala Arg Gin Arg Arg Val Gly Leu Thr Leu Ala Ala Val He 
20 25 30 



He Ala Ala Trp Leu Val Leu His Val Gly Leu Met Phe Phe Trp Pro 
35 40 45 



Leu Thr Leu His Ser Leu Leu Pro Ala Leu Pro Leu Val Val Leu Gin 
50 55 60 



Thr Trp Leu Tyr Val Gly Leu Phe He He Ala His Asp Cys Met His 
65 70 75 80 



Gly Ser Leu Val Pro Phe Lys Pro Gin Val Asn Arg Arg He Gly Gin 
85 90 95 



Leu Cys Leu Phe Leu Tyr Ala Gly Phe Ser Phe Asp Ala Leu Asn Val 
100 105 110 



Glu His His Lys His His Arg His Pro Gly Thr Ala Glu Asp Pro Asp 
115 120 125 



Phe Asp Glu Val Pro Pro His Gly Phe Trp His Trp Phe Ala Ser Phe 
130 135 140 



Phe Leu His Tyr Phe Gly Trp Lys Gin Val Ala He He Ala Ala Val 
145 150 155 160 



Ser Leu Val Tyr Gin Leu Val Phe Ala Val Pro Leu Gin Asn He Leu 
165 170 175 
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Leu Phe Trp Ala Leu Pro Gly Leu Leu Ser Ala Leu Gin Leu Phe Thr 
180 185 190 



Phe Gly Thr Tyr Leu Pro His Lys Pro Ala Thr Gin Pro Phe Ala Asp 
195 200 205 



Arg His Asn Ala Arg Thr Ser Glu Phe Pro Ala Trp Leu Ser Leu Leu 
210 215 220 



Thr Cys Phe His Phe Gly Phe His His Glu His His Leu His Pro Asp 
225 230 235 240 



Ala Pro Trp Trp Airg Leu Pro Glu He Lys Arg Arg Ala Leu Glu Arg 
245 250 255 



Arg Asp 



<210> 25 

<211> 777 

<212> DNA 

<213> Nostoc sp. 



<220> 

<221> CDS 

<222> (1)..(777) 

<400> 25 

atg gtt cag tgt caa cca tea tct ctg cat tea gaa aaa ctg gtg tta 48 
Met Val Gin Cys Gin Pro Ser Ser Leu His Ser Glu Lys Leu Val Leu 
1 5 10 15 



ttg tea teg aca ate aga gat gat aaa aat att aat aag ggt ata ttt 96 
Leu Ser Ser Thr He Arg Asp Asp Lys Asn He Asn Lys Gly He Phe 
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20 25 30 

att gcc tgc ttt ate tta ttt tta tgg gca att agt tta ate tta tta 144 
lie Ala Cys Phe lie Leu Phe Leu Trp Ala lie Ser Leu lie Leu Leu 
35 40 45 

etc tea ata gat aca tec ata att cat aag age tta tta ggt ata gcc 192 
Leu Ser lie Asp Thr Ser lie lie His Lys Ser Leu Leu Gly lie Ala 
50 55 60 

atg ctt tgg cag ace ttc tta tat aca ggt tta ttt att act get cat 240 
Met Leu Trp Gin Thr Phe Leu Tyr Thr Gly Leu Phe He Thr Ala His 
65 70 75 80 

gat gcc atg cac ggc gta gtt tat ccc aaa aat ccc aga ata aat aat 288 
Asp Ala Met His Gly Val Val Tyr Pro Lys Asn Pro Arg He Asn Asn 
85 90 95 

ttt ata ggt aag etc act eta ate ttg tat gga eta etc cct tat aaa 336 
Phe He Gly Lys Leu Thr Leu He Leu Tyr Gly Leu Leu Pro Tyr Lys 
100 105 110 

gat tta ttg aaa aaa cat tgg tta cac cac gga cat cct ggt act gat 384 
Asp Leu Leu Lys Lys His Trp Leu His His Gly His Pro Gly Thr Asp 
115 120 125 

tta gac cct gat tat tac aat ggt cat ccc caa aac ttc ttt ctt tgg 432 
Leu Asp Pro Asp Tyr Tyr Asn Gly His Pro Gin Asn Phe Phe Leu Trp 
130 135 140 

tat eta cat ttt atg aag tct tat tgg cga tgg acg caa att ttc gga 480 
Tyr Leu His. Phe Met Lys Ser Tyr Trp Arg Trp Thr Gin He Phe Gly 
145 150 155 160 

tta gtg atg att ttt cat gga ctt aaa aat ctg gtg cat ata cca gaa 528 
Leu Val Met He Phe His Gly Leu Lys Asn Leu Val His He Pro Glu 
165 170 175 



aat aat tta att ata ttt tgg atg ata cct tct att tta agt tea gta 
Asn Asn Leu He He Phe Trp Met He Pro Ser He Leu Ser Ser Val 
180 185 190 



576 
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caa eta ttt tat ttt ggt aca ttt ttg cct cat aaa aag eta gaa ggt 
Gin Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Lys Lys Leu Glu Gly 
195 200 205 

ggt tat act aac ccc cat tgt gcg cgc agt ate cca tta cct ctt ttt 
Gly Tyr Thr Asn Pro His Cys Ala Arg Ser He Pro Leu Pro Leu Phe 
210 215 220 

tgg tct ttt gtt act tgt tat cac ttc ggc tac cac aag gaa cat cac 
Trp Ser Phe Val Thr Cys Tyr His Phe Gly Tyr His Lys Glu His His 
225 230 235 240 

gaa tac cct caa ctt cct tgg tgg aaa tta cct gaa get cac aaa ata 
Glu Tyr Pro Gin Leu Pro Trp Trp Lys Leu Pro Glu Ala His Lys He 
245 250 255 

tct tta taa 
Ser Leu 



<210> 26 

<211> 258 

<212> PRT 

<213> Nostoc sp. 

<400> 26 

Met Val Gin Cys Gin Pro Ser Ser Leu His Ser Giu Lys Leu Val Leu 
15 10 15 



Leu Ser Ser Thr He Arg Asp Asp Lys Asn He Asn Lys Gly He Phe 
20 25 30 



He Ala Cys Phe He Leu Phe Leu Trp Ala He Ser Leu He Leu Leu 
35 40 45 



624 



672 



720 



768 



777 



Leu Ser He Asp Thr Ser He He His Lys Ser Leu Leu Gly He Ala 
50 55 60 
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Met Leu Trp Gin Thr Phe Leu Tyr Thr Gly Leu Phe lie Thr Ala His 
65 70 .75 80 



Asp Ala Met His Gly Val Val Tyr Pro Lys Asn Pro Arg lie Asn Asn 
85 90 95 



Phe lie Gly Lys Leu Thr Leu He Leu Tyr Gly Leu Leu Pro Tyr Lys 
100 105 110 



Asp Leu Leu Lys Lys His Trp Leu His His Gly His Pro Gly Thr Asp 
115 120 125 



Leu Asp Pro Asp Tyr Tyr Asn Gly His Pro Gin Asn Phe Phe Leu Trp 
130 135 140 



Tyr Leu His Phe Met Lys Ser Tyr Trp Arg Trp Thr Gin He Phe Gly 
145 150 155 160 



Leu Val Met He Phe His Gly Leu Lys Asn Leu Val His He Pro Glu 
165 170 175 



Asn Asn Leu He He Phe Trp Met He Pro Ser He Leu Ser Ser Val 
180 185 190 



Gin Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Lys Lys Leu Glu Gly 
195 200 205 



Gly Tyr Thr Asn Pro His Cys Ala Arg Ser He Pro Leu Pro Leu Phe 
210 215 220 
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Trp Ser Phe Val Thr Cys Tyr His Phe Gly Tyr His Lys Glu His His 
225 230 235 240 



Glu Tyr Pro Gin Leu Pro Trp Trp Lys Leu Pro Glu Ala His Lys lie 
245 250 255 



Ser Leu 



<210> 
<211> 
<212> 



27 

789 

DNA 



<213> Nostoc punctiforme 



<220> 

<221> CDS 

<222> (1)..(789) 



<400> 27 

ttg aat ttt tgt gat aaa cca gtt age tat tat gtt gca ata gag caa 
Leu Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala lie Glu Gin 
15 10 15 



48 



tta agt get aaa gaa gat act gtt tgg ggg ctg gtg att gtc ata gta 
Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val lie Val lie Val 
20 25 30 



96 



att att agt ctt tgg gta get agt ttg get ttt tta eta get att aat 
lie lie Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala He Asn 
35 40 45 



144 



tat gee aaa gtc cca att tgg ttg ata cct att gca ata gtt tgg caa 
Tyr Ala Lys Val Pro He Trp Leu He Pro He Ala He Val Trp Gin 
50 55 60 



192 



atg ttc ctt tat aca ggg eta ttt att act gca cat gat get atg cat 
Met Phe Leu Tyr Thr Gly Leu Phe He Thr Ala His Asp Ala Met His 
65 70 75 80 



240 
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ggg tea gtt tat cgt aaa aat ccc aaa att aat aat ttt ate ggt tea 288 
Gly Ser Val Tyr Arg Lys Asn Pro I*ys lie Asn Asn Phe He Gly Ser 
85 90 95 

eta get gta gcg ctt tac get gtg ttt cca tat caa cag atg tta aag 336 
Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gin Gin Met Leu Lys 
100 105 110 

aat cat tgc tta cat cat cgt cat cct get age gaa gtt gac cca gat 384 
Asn His Cys Leu His His Arg His Pro Ala Ser Glu Val Asp Pro Asp 
115 120 125 

ttt cat gat ggt aag aga aca aac get att ttc tgg tat etc cat ttc 432 
Phe His Asp Gly Lys Arg Thr Asn Ala He Phe Trp Tyr Leu His Phe 
130 135 140 

atg ata gaa tac tec agt tgg caa cag tta ata gta eta act ate eta 480 
Met He Glu Tyr Ser Ser Trp Gin Gin Leu He Val Leu Thr He Leu 
145 150 155 160 

ttt aat tta get aaa tac gtt ttg cac ate cat caa ata aat etc ate 528 
Phe Asn Leu Ala Lys Tyr Val Leu His lie His Gin He Asn Leu He 
165 170 175 

tta ttt tgg agt att cct cca att tta agt tec att caa ctg ttt tat 576 
Leu Phe Trp Ser He Pro Pro He Leu Ser Ser He Gin Leu Phe Tyr 
180 185 190 

ttc gga aca ttt ttg cct cat cga gaa ccc aag aaa gga tat gtt tat 624 
Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr 
195 200 205 

ccc cat tgc age caa aca ata aaa ttg cca act ttt ttg tea ttt ate 672 
Pro His Cys Ser Gin Thr He Lys Leu Pro Thr Phe Leu Ser Phe He 
210 215 220 

get tgc tac cac ttt ggt tat cat gaa gaa cat cat gag tat ccc cat 720 
Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His 
225 230 235 240 



gta cct tgg tgg caa ctt cca tct gta tat aag cag aga gta ttc aac 



768 
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Val Pro Trp Trp Gin Leu Pro Ser Val Tyr Lys Gin Arg Val Phe Asn 
245 250 255 

aat tea gta acc aat teg taa 
Asn Ser Val Thr Asn Ser 
260 



<210> 28 
<211> 262 
<212> PRT 

<213> Nostoc punctiforme 
<400> 28 

Leu Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala He Glu Gin 
15 10 15 



Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val He Val He Val 
20 25 30 



He He Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala He Asn 
35 40 45 



Tyr Ala Lys Val Pro He Trp Leu He Pro He Ala He Val Trp Gin 
50 55 60 



Met Phe Leu Tyr Thr Gly Leu Phe He Thr Ala His Asp Ala Met His 
65 70 75 80 



Gly Ser Val Tyr Arg Lys Asn Pro Lys He Asn Asn Phe He Gly Ser 
85 90 95 



789 



Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gin Gin Met Leu Lys 
100 105 HO 
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Asn His Cys Leu His His Arg His Pro Ala Ser Glu Val Asp Pro Asp 
115 120 125 



Phe His Asp Gly Lys Arg Thr Asn Ala lie Phe Trp Tyr Leu His Phe 
130 135 140 



Met He Glu Tyr Ser Ser Trp Gin Gin Leu He Val Leu Thr He Leu 
145 150 155. 160 



Phe Asn Leu Ala Lys Tyr Val Leu His He His Gin He Asn Leu He 
165 170 175 



Leu Phe Trp Ser He Pro Pro He Leu Ser Ser He Gin Leu Phe Tyr 
180 185 190 



Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr 
195 200 205 



Pro His Cys Ser Gin Thr He Lys Leu Pro Thr Phe Leu Ser Phe He 
210 215 220 



Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His 
225 230 235 240 



Val Pro Trp Trp Gin Leu Pro Ser Val Tyr Lys Gin Arg Val Phe Asn 
245 250 255 



Asn Ser Val Thr Asn Ser 
260 



<210> 29 
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<211> 762 
<212> DNA 

<213> Nostoc punctiforme 



ggc gta gta ttt ccc caa aac acc aag att aat cat ttg att gga aca 
Gly Val Val Phe Pro Gin Asn Thr Lys He Asn His Leu He Gly Thr 
85 90 95 

ttg acc eta tec ctt tat ggt ctt tta cca tat caa aaa eta ttg aaa 
Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gin Lys Leu Leu Lys 
100 105 HO 



48 



96 



<220> 

<221> CDS 
<222> (1)..(762) 

<400> 29 

gtg ate cag tta gaa caa cca etc agt cat caa gca aaa ctg act cca 
Val He Gin Leu Glu Gin Pro Leu Ser His Gin Ala Lys Leu Thr Pro 
15 10 15 

gta ctg aga agt aaa tct cag ttt aag ggg ctt ttc att get att gtc 
Val Leu Arg Ser Lys Ser Gin Phe Lys Gly Leu Phe He Ala He Val 
20 25 30 

att gtt age gca tgg gtc att age ctg agt tta tta ctt tec ctt gac 144 
He Val Ser Ala Trp Val He Ser Leu Ser Leu Leu Leu Ser Leu Asp 
35 40 45 

ate tea aag eta aaa ttt tgg atg tta ttg cct gtt ata eta tgg caa 192 
He Ser Lys Leu Lys Phe Trp Met Leu Leu Pro Val He Leu Trp Gin 
50 55 60 

aca ttt tta tat acg gga tta ttt att aca tct cat gat gee atg cat 240 
Thr Phe Leu Tyr Thr Gly Leu Phe He Thr Ser His Asp Ala Met His 
65 70 75 80 



288 



336 



aaa cat tgg tta cac cac cac aat cca gca age tea ata gac ccg gat 
Lys His Trp Leu His His His Asn Pro Ala Ser Ser He Asp Pro Asp 
115 120 125 



384 
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ttt cac aat ggt aaa cac caa agt ttc ttt get tgg tat ttt cat ttt 432 
Phe His Asn Gly Lys His Gin Ser Phe Phe Ala Trp Tyr Phe His Phe 
130 135 140 

atg aaa ggt tac tgg agt tgg ggg caa ata att gcg ttg act att att . 480 
Met Lys Gly Tyr Trp Ser Trp Gly Gin He He Ala Leu Thr He He 
145 150 155 160 

tat aac ttt get aaa tac ata etc cat ate cca agt gat aat eta act 528 
Tyr Asn Phe Ala Lys Tyr He Leu His He Pro Ser Asp Asn Leu Thr 
165 170 175 

tac ttt tgg gtg eta ccc teg ctt tta agt tea tta caa tta ttc tat 576 
Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gin Leu Phe Tyr 
180 185 190 

ttt ggt act ttt tta ccc cat agt gaa cca ata ggg ggt tat gtt cag 624 
Phe Gly Thr Phe Leu Pro His Ser Glu Pro He Gly Gly Tyr Val Gin 
195 200 205 

cct cat tgt gee caa aca att age cgt cct att tgg tgg tea ttt ate 672 
Pro His Cys Ala Gin Thr He Ser Arg Pro He Trp Trp Ser Phe He 
210 215 220 

acg tgc tat cat ttt ggc tac cac gag gaa cat cac gaa tat cct cat 720 
Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His 
225 230 235 240 

att tct tgg tgg cag tta cca gaa att tac aaa gca aaa tag 762 
He Ser Trp Trp Gin Leu Pro Glu He Tyr Lys Ala Lys 
245 250 



<210> 30 

<211> 253 

<212> PRT 

<213> Nostoc 

<400> 30 



punctiforme 



Val He Gin Leu Glu Gin Pro Leu Ser Hrs Gin Ala Lys Leu Thr Pro 
15 10 15 



WO 2004/063358 



71/358 



PCT/EP2004/000100 



Val Leu Arg Ser Lys Ser Gin Plie Lys Gly Leu Phe lie Ala lie Val 
20 25 30 



lie Val Ser Ala Trp Val lie Ser Leu Ser Leu Leu Leu Ser Leu Asp 
35 40 45 



lie Ser Lys Leu Lys Phe Trp Met Leu Leu Pro Val He Leu Trp Gin 
50 55 60 



Thr Phe Leu Tyr Thr Gly Leu Phe He Thr Ser His Asp Ala Met His 
65 70 75 80 



Gly Val Val Phe Pro Gin Asn Thr Lys He Asn His Leu He Gly Thr 
85 90 95 



Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gin Lys Leu Leu Lys 
100 105 110 



Lys His Trp Leu His His His Asn Pro Ala Ser Ser He Asp Pro Asp 
115 120 125 



Phe His Asn Gly Lys His Gin Ser Phe Phe Ala Trp Tyr Phe His Phe 
130 135 140 



Met Lys Gly Tyr Trp Ser Trp Gly Gin lie He Ala Leu Thr He He 
145 150 155 160 



Tyr Asn Phe Ala Lys Tyr He Leu His He Pro Ser Asp Asn Leu Thr 
165 170 175 
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Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gin Leu Phe Tyr 
180 185 190 



Phe Gly Thr Phe Leu Pro His Ser Glu Pro lie Gly Gly Tyr Val Gin 
195 200 205 



Pro His Cys Ala Gin Thr lie Ser Arg Pro lie Trp Trp Ser Phe lie 
210 215 220 



Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His 
225 230 235 240 



lie Ser Trp Trp Gin Leu Pro Glu lie Tyr Lys Ala Lys 
245 250 



<210> 31 

<211> 1608 

<212> DNA 

<213> Haematococcus pluvialis 
<220> 

<221> CDS 

<222> (3).. (971) 

<400> 31 

ct aca ttt cac aag ccc gtg age ggt gca age get ctg ccc cac ate 47 

Thr Phe His Lys Pro Val Ser Gly Ala Ser Ala Leu Pro His lie 
15 10 15 

ggc cca cct cct cat etc cat egg tea ttt get get acc acg atg ctg 95 
Gly Pro Pro Pro His Leu His Arg Ser Phe Ala Ala Thr Thr Met Leu 
20 25 30 

teg aag ctg cag tea ate age gtc aag gee cgc cgc gtt gaa eta gee 143 
Ser Lys Leu Gin Ser He Ser Val Lys Ala Arg Arg Val Glu Leu Ala 
35 40 45 
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cgc gac ate acg egg ccc aaa gtc tgc ctg cat get cag egg tgc teg 191 
Arg Asp lie Thx Arg Pro Lys Val Cys Leu His Ala Gin Arg Cys Ser 
50 55 60 

tta gtt egg ctg cga gtg gca gca cca cag aca gag gag gcg ctg gga 239 
Leu Val Arg Leu Arg Val Ala Ala Pro Gin Thr Glu Glu Ala Leu Gly 
65 70 75 

ace gtg cag get gee ggc gcg ggc gat gag cac age gee gat gta gca 287 
Thx Val Gin Ala Ala Gly Ala Gly Asp Glu His Ser Ala Asp Val Ala 
80 85 90 95 

etc cag cag ctt gac egg get ate gca gag cgt cgt gee egg cgc aaa 335 
Leu Gin Gin Leu Asp Arg Ala lie Ala Glu Arg Arg Ala Arg Arg Lys 
100 105 110 

egg gag cag ctg tea tac cag get gee gee att gca gca tea att ggc 383 
Arg Glu Gin Leu Ser Tyr Gin Ala Ala Ala lie Ala Ala Ser He Gly 
115 120 125 

* gtg tea ggc att gee ate ttc gee ace tac ctg aga ttt gee atg cac 431 
Val Ser Gly He Ala He Phe Ala Thr Tyr Leu Arg Phe Ala Met His 
130 135 140 

atg ace gtg ggc ggc gca gtg cca tgg ggt gaa gtg get ggc act etc 479 
Met Thr Val Gly Gly Ala Val Pro Trp Gly Glu Val Ala Gly Thr Leu 
145 150 155 

etc ttg gtg gtt ggt ggc gcg etc ggc atg gag atg tat gee cgc tat 527 
Leu Leu Val Val Gly Gly Ala Leu Gly Met Glu Met Tyr Ala Arg Tyr 
160 165 170 175 

gca cac aaa gee ate tgg cat gag teg cct ctg ggc tgg ctg ctg cac 575 
Ala His Lys Ala He Trp His Glu Ser Pro Leu Gly Trp Leu Leu His 
180 185 190 

aag age cac cac aca cct cgc act gga ccc ttt gaa gee aac gac ttg 623 
Lys Ser His His Thr Pro Arg Thr Gly Pro Phe Glu Ala Asn Asp Leu 
195 200 205 



ttt gca ate ate aat gga ctg ccc gee atg etc ctg tgt ace ttt ggc 



671 



WO 2004/063358 



74/358 



PCT/EP2004/000100 



Phe Ala He He Asn Gly Leu Pro Ala Met Leu Leu Cys Thr Phe Gly 
210 215 220 

ttc tgg ctg ccc aac gtc ctg ggg gcg gcc tgc ttt gga gcg ggg ctg 719 
Phe Trp Leu Pro Asn Val Leu Gly Ala Ala Cys Phe Gly Ala Gly Leu 
225 230 235 

ggc ate acg eta tac ggc atg gca tat atg ttt gta cac gat ggc ctg 767 
Gly He Thr Leu Tyr Gly Met Ala Tyr Met Phe Val His Asp Gly Leu 
240 245 250 255 

gtg cac agg cgc ttt ccc acc ggg ccc ate get ggc ctg ccc tac atg 815 
Val His Arg Arg Phe Pro Thr Gly Pro He Ala Gly Leu Pro Tyr Met 
260 265 270 

aag cgc ctg aca gtg gcc cac cag eta cac cac age ggc aag tac ggt 863 
Lys Arg Leu Thr Val Ala His Gin Leu His His Ser Gly Lys Tyr Gly 
275 280 285 

ggc gcg ccc tgg ggt atg ttc ttg ggt cca cag gag ctg cag cac att 911 
Gly Ala Pro Trp Gly Met Phe Leu Gly Pro Gin Glu Leu Gin His He 
290 295 300 

cca ggt gcg gcg gag gag gtg gag cga ctg gtc ctg gaa ctg gac tgg 959 
Pro Gly Ala Ala Glu Glu Val Glu Arg Leu Val Leu Glu Leu Asp Trp 
305 310 315 

tec aag egg tag ggtgcggaac caggcacgct ggtttcacac ctcatgcctg 1011 

Ser Lys Arg 

320 

tgataaggtg tggctagagc gatgcgtgtg agaegggtat gtcaeggteg actggtctga 1071 

tggccaatgg catcggccat gtctggtcat caegggctgg ttgcctgggt gaaggtgatg 1131 

cacatcatca tgtgcggttg gaggggctgg cacagtgtgg gctgaactgg agcagttgtc 1191 

caggctggcg ttgaatcagt gagggtttgt gattggcggt tgtgaagcaa tgactccgcc 1251 

catattctat ttgtgggagc tgagatgatg geatgettgg gatgtgcatg gatcatggta 1311 



gtgcagcaaa ctatattcac ctagggctgt tggtaggatc aggtgaggee ttgcacattg 
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catgatgtac tcgtcatggt gtgttggtga gaggatggat gtggatggat gtgtattctc 1431 

agacgtagac cttgactgga ggcttgatcg agagagtggg ccgtattctt tgagagggga 1491 

ggctcgtgcc agaaatggtg agtggatgac tgtgacgctg tacattgcag gcaggtgaga 1551 

tgcactgtct cgattgtaaa atacattcag atgcaaaaaa aaaaaaaaaa aaaaaaa 1608 

<210> 32 

<211> 322 

<212> PRT 

<213> Haematococcus pluvialis 

<400> 32 

Thr Phe His Lys Pro Val Ser Gly Ala Ser Ala Leu Pro His lie Gly 
1 5 10 15 



Pro Pro Pro His Leu His Arg Ser Phe Ala Ala Thr Thr Met Leu Ser 
20 25 30 



Lys Leu Gin Ser lie Ser Val Lys Ala Arg Arg Val Glu Leu Ala Arg 
35 40 45 



Asp lie Thr Arg Pro Lys Val Cys Leu His Ala Gin Arg Cys Ser Leu 
50 55 60 



Val Arg Leu Arg Val Ala Ala Pro Gin Thr Glu Glu Ala Leu Gly Thr 
65 70 75 80 



Val Gin Ala Ala Gly Ala Gly Asp Glu His Ser Ala Asp Val Ala Leu 
85 90 95 



Gin Gin Leu Asp Arg Ala He Ala Glu Arg Arg Ala Arg Arg Lys Arg 
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100 



76/358 
105 



PCT/EP2004/000100 

110 



Glu Gin Leu Ser Tyr Gin Ala Ala Ala lie Ala Ala Ser lie Gly Val 
115 120 125 



Ser Gly lie Ala lie Phe Ala Thr Tyr Leu Arg Phe Ala Met His Met 
130 135 140 



Thr Val Gly Gly Ala Val Pro Trp Gly Glu Val Ala Gly Thr Leu Leu 
145 150 * 155 160 



Leu Val Val Gly Gly Ala Leu Gly Met Glu Met Tyr Ala Arg Tyr Ala 
165 170 175 



His Lys Ala lie Trp His Glu Ser Pro Leu Gly Trp Leu Leu His Lys 
180 185 190 



Ser His His Thr Pro Arg Thr Gly Pro Phe Glu Ala Asn Asp Leu Phe 
195 200 205 



Ala He He Asn Gly Leu Pro Ala Met Leu Leu Cys Thr Phe Gly Phe 
210 215 220 



Trp Leu Pro Asn Val Leu Gly Ala Ala Cys Phe Gly Ala Gly Leu Gly 
225 230 235 240 



He Thr Leu Tyr Gly Met Ala Tyr Met Phe Val His Asp Gly Leu Val 
245 250 255 



His Arg Arg Phe Pro Thr Gly Pro He Ala Gly Leu Pro Tyr Met Lys 
260 265 270 
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Arg Leu Thr Val Ala His Gin Leu His His Ser Gly Lys Tyr Gly Gly 



275 



280 



285 



Ala Pro Trp Gly Met Phe Leu Gly Pro Gin Glu Leu Gin His He Pro 



290 



295 



300 



Gly Ala Ala Glu Glu Val Glu Arg Leu Val Leu Glu Leu Asp Trp Ser 



305 



310 



315 



320 



Lys Arg 



<210> 33 

<211> 528 

<212> DNA 

<213> Erwinia uredovora 



<220> 

<221> CDS 

<222> (1)..(528) 

<400> 33 

atg ttg tgg att tgg aat gcc ctg ate gtt ttc gtt acc gtg att ggc 48 
Met Leu Trp He Trp Asn Ala Leu lie Val Phe Val Thr Val He Gly 
15 10 15 

atg gaa gtg att get gca ctg gca cac aaa tac ate atg cac ggc tgg 96 
Met Glu Val He Ala Ala Leu Ala His Lys Tyr He Met His Gly Trp 



20 



25 



30 



ggt tgg gga tgg cat ctt tea cat cat gaa ccg cgt aaa ggt gcg ttt 
Gly Trp Gly Trp His Leu Ser His His Glu Pro Arg Lys Gly Ala Phe 
35 40 45 



144 



gaa gtt aac gat ctt tat gcc gtg gtt ttt get gca tta teg ate ctg 192 
Glu Val Asn Asp Leu Tyr Ala Val Val Phe Ala Ala Leu Ser He Leu 



WO 2004/063358 PCT7EP2004/000100 

78/358 

50 55 60 

ctg att tat ctg ggc agt aca gga atg tgg ccg etc cag tgg att ggc 240 
Leu lie Tyr Leu Gly Ser Thr Gly Met Trp Pro Leu Gin Trp lie Gly 
65 70 75 80 

gca ggt atg acg gcg tat gga- tta etc tat ttt atg gtg cac gac ggg 288 
Ala Gly Met Thr Ala Tyr Gly Leu Leu Tyr Phe Met Val His Asp Gly 
85 90 95 

ctg gtg cat caa cgt tgg cca ttc cgc tat att cca cgc aag ggc tac 336 
Leu Val His Gin Arg Trp Pro Phe Arg Tyr lie Pro Arg Lys Gly Tyr 
100 105 110 

etc aaa egg ttg tat atg gcg cac cgt atg cat cac gec gtc agg ggc 384 
Leu Lys Arg Leu Tyr Met Ala His Arg Met His His Ala Val Arg Gly 
115 120 125 

aaa gaa ggt tgt gtt tct ttt ggc ttc etc tat gcg ccg ccc ctg tea 432 
Lys Glu Gly Cys Val Ser Phe Gly Phe Leu Tyr Ala Pro Pro Leu Ser 
130 135 140 

aaa ctt cag gcg acg etc egg gaa aga cat ggc get aga gcg ggc get 480 
Lys Leu Gin Ala Thr Leu Arg Glu Arg His Gly Ala Arg Ala Gly Ala 
145 150 155 160 



gee aga gat gcg cag ggc ggg gag gat gag ccc gca tec ggg aag taa 528 
Ala Arg Asp Ala Gin Gly Gly Glu Asp Glu Pro Ala Ser Gly Lys 
165 170 175 



<210> 34 

<211> 175 

<212> PRT 

<213> Erwinia uredovora 

<400> 34 



Met Leu Trp lie Trp Asn Ala Leu lie Val 
15 10 



Phe Val Thr Val 



lie Gly 
15 
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Met Glu Val He Ala Ala Leu Ala His Lys Tyr He Met His Gly Trp 
20 25 30 



Gly Trp Gly Trp His Leu Ser His His Glu Pro Arg Lys Gly Ala Phe 
35 40 45 



Glu Val Asn Asp Leu Tyr Ala Val Val Phe Ala Ala Leu Ser lie Leu 
50 55 60 



Leu He Tyr Leu Gly Ser Thr Gly Met Trp Pro Leu Gin Trp lie Gly 
65 .70 75 80 



Ala Gly Met Thr Ala Tyr Gly Leu Leu Tyr Phe Met Val His Asp Gly 
85 90 95 



Leu Val His Gin Arg Trp Pro Phe Arg Tyr He Pro Arg Lys Gly Tyx 
100 105 110 



Leu Lys Arg Leu Tyr Met Ala His Arg Met His His Ala Val Arg Gly 
115 120 125 



Lys Glu Gly Cys Val Ser Phe Gly Phe Leu Tyr Ala Pro Pro Leu Ser 
130 135 140 



Lys Leu Gin Ala Thr Leu Arg Glu Arg His Gly Ala Arg Ala Gly Ala 
145 150 155 160 



Ala Arg Asp Ala Gin Gly Gly Glu Asp Glu Pro Ala Ser Gly Lys 
165 170 175 



<210> 35 
<211> 1520 
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<212> DNA 

<213> Artificial 

<220> 

<2 2 3 > Pr omotor 
<400> 35 

ctcgagtacc gaggcggaac ggcaggaatg tttccctctc ttttagaggg caattcttta 60 

tccaatgtca tgttgatgct agatatttct gtctcttata ataaggcgaa tacccatttt 120 

tgaattgaag ttgagataaa aaaaaagggg gcccaatttg tcaacgccaa agagtcaagc 180 

tttttctttg gctttagccg aacaatctaa gacttattgt ttttgaagat atfctgacctt 240 

ttctagatat tccttcaagt aaagcttttt tcgagttttt tttttttttc tttgtgaagg 300 

atttattgtt attggtatcc attttttatt ggaagacaag ataagttaat attgattttg 360 

cttaaagatt aaaaggaaat cagaaaacga caataaaaaa tgtaacggac aaactatggt 420 

gtcgattata agtctaaatc cttaaaaaat gacaacgagt tgctttcctc tgaaaacaat 480 

tcttttgtct ttgcaagaaa ggtttctttfc ttgtttgctt gcattactta aacatcaaat 540 

caaatgaaag gaataaagca gatttgaggg cgaataagga ttttctggtc aacaagatgt 600 

gagtgacacc taaggaacta aatgccattc atttgtttta aaacgacatc aaagattgat 660 

gatcaacagg attgagagag agaaaaagaa ctcgtgtcat ttatttctgt tgactgaaat 720 

tttatattta gaaaaaatgt caaatctata gctttagcta tattacataa catttgaaat 780 

aataataata aaaaaagaca cattagagac acttttcaaa ctctaaataa ctgtctataa 840 

acacaaagaa aacaaagacc tctataacaa cttattagat ttttctcgta cttttgtcta 900 

aagatgatgt attcttgtta tcccacactt ctttcatttg ttcttgatgc tactaaatat 960 

acaaaatttc ttttttgcaa gagatattat tccaaaaatt ttcaaaaaga aatttttttc 1020 

acaatagcag ttgatcgtgt aacccaaaga ggttctttgt tattttgcac ttccgctttg 1080 
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cggtgatgca tattcaaagt aatatatgga 
gaaacaaagg ccgctttgaa caaatgcata 
cagtaaatca aacaagaaac attgctgatt 
ccactaagta tacttcaatg aactttttgt 
gtgaccattc ctgaggtggc tttggtgatg 
gatttaaaaa acaatttctg ctttgaacca 
ttatcaagta tgtacctacc ctcaaagtcc 
ccaccttctc tttagaaatg 



ataaacaacg tgtttaagca tgaaagaaag 1140 

atatttcaga caaaaatgat ctaaagcaag 1200 

cgcgttagaa aacgataaaa gtctaataag 1260 

atgcttatgg tccaatcaga ccaataattt 1320 

cggaaacaga aaaaaatttt ctcaccaatc 1380 

aaactttttt tttctcttta atcattaact 1440 

tcactcaagc acaattatgc taacattgtt 1500 

1520 



<210> 36 

<211> 16245 

<212> DNA 

<213> Artificial 

<220> 

<223> Plasmid 



<220> 

<221> misc_feature 

<222> (10264) . . (10264) 

<223> n is a, c, g, or t 

<220> 

<221> raisc_JEeature 

<222> (10472) . . (10472) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (10563) . . (10563) 

<223> n is a, c, g, or t 
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<400> 36 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 60 

aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 

aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480 

ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540 

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 

cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 660 

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 

atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 

ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 

ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 

gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 

acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 

acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 

agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 

ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 1260 
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ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 

atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 

agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 

agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 

cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 

ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 

gcaacaaccg tcttccggag act'gtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 

gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 

tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 

ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 

tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 

tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 

ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 

aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 

aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 

ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 

aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 

taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 

tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 

tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 

catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 
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tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 

tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 

attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 

cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 

ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 

agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 

cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 

tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 

attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 

tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180 

ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 

cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 

gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 

gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 

ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 

aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 

gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 

gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 

tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720 

agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 3780 
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tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 

ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 

tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 

acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 

tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 

acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 

accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg 4200 

gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 4260 

gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 

ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 

gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 

cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 

tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 

ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 

gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 

tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 

ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 

gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 

catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 

tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 

cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 
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tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 

ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 

cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 

attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 

accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 

ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 

cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 

gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 

agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 

ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 

cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 

tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 5760 

tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 5820 

cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca 5880 

caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 5940 

gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000 

tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 

cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 

tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 

taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 

accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 6300 



WO 2004/063358 PCT/EP2004/000100 

87/358 

aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 63 60 

ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 

actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 

cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 

agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 

cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 

tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 

ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 

cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 

gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 

gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 

aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 

aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 

aagaactgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 

cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 

tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 

tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gtgaaccttt 73 80 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 

tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 

gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 
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tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 

tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 

gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 

atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 

cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 

ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 

tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 7980 

cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 

accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 

tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 

acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 

cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 

agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 

gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 

atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 

gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 

ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 

cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 

tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 

aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 8760 

cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 
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tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 

ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 

gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 

tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 

ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 

accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 

ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 

ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 
gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 
aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 
cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 
ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 
gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 

gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 

tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 
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ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 
gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 
cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 10260 
cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt ttcgggagac 10320 
gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 
tccacgcgac tatatatttg tctctaattg tactttgaca tgctcctctt ctttactctg 10440 
atagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgcatgtt 10500 
tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 
canttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 
taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 
atgcacaggt acacttgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 10740 
gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgcaagctt aatctataca 10800 
atgctccata gactcacatt gatattgtcg aagatttcga tgctgactta gtagagcaac 10860 
tacaaaagtt agcagagaag catgatttct taatctttga agaccgcaag tttgcagata 10920 
tcggtatgtg aattctatct attttttttc tgatgtgtgc atggatgact catgatcata 10980 
ttcttaggta atactgtcaa gcatcaatat ggcaagggcg tttacaagat tgcttcttgg 11040 
tctcatatta ctaatgctca cacagttcct ggagaaggta ttatcaaggg acttgccgaa 11100 
gtcggcctcc ctcttggtcg tggcttgctt ttgctagcag aaatgtcatc tcaaggtgca 11160 
ttaactaagg gtatttacac tgccgaatct gtcaatatgg ctcgccgcaa caaagatttc 11220 
gtttttggct ttattgcaca acacaaaatg aatcagtatg atgatgagga ttttgttgtc 11280 
atgtcgcctg aagcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc 11340 
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cgctcacaat tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct 11400 
aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 11460 
acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 11520 
ttgggccaaa gacaaaaggg cgacattcaa ccgattgagg gagggaaggt aaatattgac 11580 
ggaaattatt cattaaaggt gaattatcac cgtcaccgac ttgagccatt tgggaattag 11640 
agccagcaaa atcaccagta gcaccattac cattagcaag gccggaaacg tcaccaatga 11700 
aaccatcgat agcagcaccg taatcagtag cgacagaatc aagtttgcct ttagcgtcag 11760 
actgtagcgc gttttcatcg gcattttcgg tcatagcccc cttattagcg tttgccatct 11820 
tttcataatc aaaatcaccg gaaccagagc caccaccgga accgcctccc tcagagccgc 11880 
caccctcaga accgccaccc tcagagccac caccctcaga gccgccacca gaaccaccac 11940 
cagagccgcc gccagcattg acaggaggcc cgatctagta acatagatga caccgcgcgc 12000 
gataatttat cctagtttgc gcgctatatt ttgttttcta tcgcgtatta aatgtataat 12060 
tgcgggactc taatcataaa aacccatctc ataaataacg tcatgcatta catgttaatt 12120 
attacatgct taacgtaatt caacagaaat tatatgataa tcatcgcaag accggcaaca 12180 
ggattcaatc ttaagaaact ttattgccaa atgtttgaac gatcggggat catccgggtc 12240 
tgtggcggga actccacgaa aatatccgaa cgcagcaaga tatcgcggtg catctcggtc 12300 
ttgcctgggc agtcgccgcc gacgccgttg atgtggacgc cgggcccgat catattgtcg 12360 
ctcaggatcg tggcgttgtg cttgtcggcc gttgctgtcg taatgatatc ggcaccttcg 12420 
accgcctgtt ccgcagagat cccgtgggcg aagaactcca gcatgagatc cccgcgctgg 12480 
aggatcatcc agccggcgtc ccggaaaacg attccgaagc ccaacctttc atagaaggcg 12540 
gcggtggaat cgaaatctcg tgatggcagg ttgggcgtcg cttggtcggt catttcgaac 12600 
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cccagagtcc cgctcagaag aactcgtcaa gaaggcgata gaaggcgatg cgctgcgaat 12660 
cgggagcggc gataccgtaa agcacgagga agcggtcagc ccattcgccg ccaagctctt 12720 
cagcaatatc acgggtagcc aacgctatgt cctgatagcg gtccgccaca cccagccggc 12780 
cacagtcgat gaatccagaa aagcggccat tttccaccat gatattcggc aagcaggcat 12840 
cgccatgggt cacgacgaga tcatcgccgt cgggcatgcg cgccttgagc ctggcgaaca 12900 
gttcggctgg cgcgagcccc tgatgctctt cgtccagatc atcctgatcg acaagaccgg 12960 
cttccatccg agtacgtgct cgctcgatgc gatgtttcgc ttggtggtcg aatgggcagg 13020 
tagccggatc aagcgtatgc agccgccgca ttgcatcagc catgatggat actttctcgg 13080 
caggagcaag gtgagatgac aggagatcct gccccggcac ttcgcccaat agcagccagt 13140 
cccttcccgc ttcagtgaca acgtcgagca cagctgcgca aggaacgccc gtcgtggcca 13200 
gccacgatag ccgcgctgcc tcgtcctgca gttcattcag ggcaccggac aggtcggtct 13260 
tgacaaaaag aaccgggcgc ccctgcgctg acagccggaa cacggcggca tcagagcagc 13320 
cgattgtctg ttgtgcccag tcatagccga atagcctctc cacccaagcg gccggagaac 13380 
ctgcgtgcaa tccatcttgt tcaatcatgc gaaacgatcc agatccggtg cagattattt 13440 
ggattgagag tgaatatgag actctaattg gataccgagg ggaatttatg gaacgtcagt 13500 
ggagcatttt tgacaagaaa tatttgctag ctgatagtga ccttaggcga cttttgaacg 13560 
cgcaataatg gtttctgacg tatgtgctta gctcattaaa ctccagaaac ccgcggctga 13620 
gtggctcctt caacgttgcg gttctgtcag ttccaaacgt aaaacggctt gtcccgcgtc 13680 
atcggcgggg gtcataacgt gactccctta attctccgct catgatcaga ttgtcgtttc 13740 
ccgccttcag tttaaactat cagtgtttga caggatatat tggcgggtaa acctaagaga 13800 
aaagagcgtt tattagaata atcggatatt taaaagggcg tgaaaaggtt tatccgttcg 13860 
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tccatttgta tgtgcatgcc aaccacaggg ttccccagat ctggcgccgg ccagcgagac 13920 
gagcaagatt ggccgccgcc cgaaacgatc cgacagcgcg cccagcacag gtgcgcaggc 13980 
aaattgcacc aacgcataca gcgccagcag aatgccatag tgggcggtga cgtcgttcga 14040 
gtgaaccaga tcgcgcagga ggcccggcag caccggcata atcaggccga tgccgacagc 14100 
gtcgagcgcg acagtgctca gaattacgat caggggtatg ttgggtttca cgtctggcct 14160 
ccggaccagc ctccgctggt ccgattgaac gcgcggattc tttatcactg ataagttggt 14220 
ggacatatta tgtttatcag tgataaagtg tcaagcatga caaagttgca gccgaataca 14280 
gtgatccgtg ccgccctgga cctgttgaac gaggtcggcg tagacggtct gacgacacgc 14340 
aaactggcgg aacggttggg ggttcagcag ccggcgcttt actggcactt caggaacaag 14400 
cgggcgctgc tcgacgcact ggccgaagcc atgctggcgg agaatcatac gcattcggtg 14460 
ccgagagccg acgacgactg gcgctcattt ctgatcggga atgcccgcag cttcaggcag 14520 
gcgctgctcg cctaccgcga tggcgcgcgc atccatgccg gcacgcgacc gggcgcaccg 14580 
cagatggaaa cggccgacgc gcagcttcgc ttcctctgcg aggcgggttt ttcggccggg 14640 
gacgccgtca atgcgctgat gacaatcagc tacttcactg ttggggccgt gcttgaggag 14700 
caggccggcg acagcgatgc cggcgagcgc ggcggcaccg ttgaacaggc tccgctctcg 14760 
ccgctgttgc gggccgcgat agacgccttc gacgaagccg gtccggacgc agcgttcgag 14820 
cagggactcg cggtgattgt cgatggattg gcgaaaagga ggctcgttgt caggaacgtt 14880 
gaaggaccga gaaagggtga cgattgatca ggaccgctgc cggagcgcaa cccactcact 14940 
acagcagagc catgtagaca acatcccctc cccctttcca ccgcgtcaga cgcccgtagc 15000 
agcccgctac gggctttttc atgccctgcc ctagcgtcca agcctcacgg ccgcgctcgg 15060 
cctctctggc ggccttctgg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 15120 
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tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 15180 

aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 15240 

gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 15300 

aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 15360 

ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 15420 

tgtccgcctt tctcccttcg ggaagcgtgg cgcttttccg ctgcataacc ctgcttcggg 15480 

gtcattatag cgattttttc ggtatatcca tcctttttcg cacgatatac aggattttgc 15540 

caaagggttc gtgtagactt tccttggtgt atccaacggc gtcagccggg caggataggt 15600 

gaagtaggcc cacccgcgag cgggtgttcc ttcttcactg tcccttattc gcacctggcg 15660 

gtgctcaacg ggaatcctgc tctgcgaggc tggccggcta ccgccggcgt aacagatgag 15720 

ggcaagcgga tggctgatga aaccaagcca accaggaagg gcagcccacc tatcaaggtg 15780 

tactgccttc cagacgaacg aagagcgatt gaggaaaagg cggcggcggc cggcatgagc 15840 

ctgtcggcct acctgctggc cgtcggccag ggctacaaaa tcacgggcgt cgtggactat 15900 
gagcacgtcc gcgagctggc ccgcatcaat ggcgacctgg gccgcctggg cggcctgctg 15960 
aaactctggc tcaccgacga cccgcgcacg gcgcggttcg gtgatgccac gatcctcgcc 16020 
ctgctggcga agatcgaaga gaagcaggac gagcttggca aggtcatgat gggcgtggtc 16080 
cgcccgaggg cagagccatg acttttttag ccgctaaaac ggccgggggg tgcgcgtgat 16140 
tgccaagcac gtccccatgc gctccatcaa gaagagcgac ttcgcggagc tggtgaagta 16200 
catcaccgac gagcaaggca agaccgagcg cctttgcgac gctca 16245 

<210> 37 
<211> 17877 
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<212> DNA 

<213> Artificial 

<220> 

< 2 2 3 > Promo tor 



<220> 

<221> misc_f eature 

<222> (10264) . . (10264) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (10472) (10472) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (10563) . . (10563) 

<223> n is a, c, g, or t 

<400> 37 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccagr 60 

aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 

aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480 

ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540 



tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 



600 
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cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 660 

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 

atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 

ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 

ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 

gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 

acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 

acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 

agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 

ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 1260 

ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 

atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 

agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 

agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 

cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 

ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 

gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 

gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 

tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 
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ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 

tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 

tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 

ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 

aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 

aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 

ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 

aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 

taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 

tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 

tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 

catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 

tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 

tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 

attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 

cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 

ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 

agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 

cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 

tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 
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attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 

tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180 

ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 

cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 

gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 

gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 

ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 

aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 

gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 

gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 

tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720 

agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 3780 

tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 

ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 
tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3^960 
acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 
tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 
acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 
accgcgttgg gcacctggaa tcggtgtcgc . tgctgcaccg cttccgcgtc ctggaccgtg 4200 
gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 42 60 
gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 
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ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 

gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 

cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 

tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 

ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 

gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 

tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 

ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 

gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 

catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 

tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 

cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 

tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 

ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 

cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 

attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 

accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 

ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 
cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 
gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 
agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 
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ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 

cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 

tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 5760 

tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 5820 

cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca 5880 

caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 5940 

gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000 

tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 

cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 
tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 
taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 
accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 63 00 
aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 6360 
ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 
actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 
cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 
ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 
agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 
cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 
tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 
ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 
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cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 

gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 

gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 

aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 

aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 

aagaactgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 

cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 

tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 

tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gtgaaccttt 7380 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 

tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 

gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 

tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 

tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 

gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 

atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 

cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 

ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 

tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 7980 

cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 

accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 
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tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 

acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 

cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 

agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 

gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 

atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 

gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 

ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 

cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 

tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 

aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 8760 

cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 

tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 

ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 

gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 

tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 
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ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 

accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 

ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 

ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 

gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 

aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 

cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 

ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 

gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 

gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 

tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 

ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 

gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 

cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 10260 

cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt ttcgggagac 10320 

gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 

tccacgcgac tatatatttg tctctaattg tactttgaca tgctcctctt ctttactctg 10440 

atagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgcatgtt 10500 

tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 
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canttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 
taacacccaa tacgccggcc gaaacttttt tacaadtctc ctatgagtcg tttacccaga 10680 
atgcacaggt acacttgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 10740 
gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgcaagctt ttttcgagtt 10800 
tttttttttt ttctttgtga aggatttatt gttattggta tccatttttt attggaagac 10860 
aagataagtt aatattgatt ttgcttaaag attaaaagga aatcagaaaa cgacaataaa 10920 
aaatgtaacg gacaaactat ggtgtcgatt ataagtctaa atccttaaaa aatgacaacg 10980 
agttgctttc ctctgaaaac aattcttttg tctttgcaag aaaggtttct tttttgtttg 11040 
cttgcattac ttaaacatca aatcaaatga aaggaataaa gcagatttga gggcgaataa 11100 
ggattttctg gtcaacaaga tgtgagtgac acctaaggaa ctaaatgcca ttcatttgtt 11160 
ttaaaacgac atcaaagatt gatgatcaac aggattgaga gagagaaaaa gaactcgtgt 11220 
catttatttc tgttgactga aattttatat ttagaaaaaa tgtcaaatct atagctttag 11280 
ctatattaca taacatttga aataataata ataaaaaaag acacattaga gacacttttc 11340 
aaactctaaa taactgtcta taaacacaaa gaaaacaaag acctctataa caacttatta 11400 
gatttttctc gtacttttgt ctaaagatga tgtattcttg ttatcccaca cttctttcat 11460 
ttgttcttga tgctactaaa tatacaaaat ttcttttttg caagagatat tattccaaaa 11520 
attttcaaaa agaaattttt ttcacaatag cagttgatcg tgtaacccaa agaggttctt 11580 
tgttattttg cacttccgct ttgcggtgat gcatattcaa agtaatatat ggaataaaca 11640 
acgtgtttaa gcatgaaaga aaggaaacaa aggccgcttt gaacaaatgc ataatatttc 11700 
agacaaaaat gatctaaagc aagcagtaaa tcaaacaaga aacattgctg attcgcgtta 11760 
gaaaacgata aaagtctaat aagccactaa gtatacttca atgaactttt tgtatgctta 11820 
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tggtccaatc agaccaataa tttgtgacca ttcctgaggt ggctttggtg atgcggaaac 11880 

agaaaaaaat tttctcacca atcgatttaa aaaacaattt ctgctttgaa ccaaaacttt 11940 

ttttttctct ttaatcatta actttatcaa gtatgtacct accctcaaag tcctcactca 12000 

agcacaatta tgctaacatt gttccacctt ctctttagaa atgctgtcga agctgcagtc 12060 

aatcagcgtc aaggcccgcc gcgttgaact agcccgcgac atcacgcggc ccaaagtctg 12120 

cctgcatgct cagcggtgct cgttagttcg gctgcgagtg gcagcaccac agacagagga 12180 

ggcgctggga accgtgcagg ctgccggcgc gggcgatgag cacagcgccg atgtagcact 12240 

ccagcagctt gaccgggcta tcgcagagcg tcgtgcccgg cgcaaacggg agcagctgtc 12300 

ataccaggct gccgccattg cagcatcaat tggcgtgtca ggcattgcca tcttcgccac 12360 

ctacctgaga tttgccatgc acatgaccgt gggcggcgca gtgccatggg gtgaagtggc 12420 

tggcactctc ctcttggtgg ttggtggcgc gctcggcatg gagatgtatg cccgctatgc 12480 

acacaaagcc atctggcatg agtcgcctct gggctggctg ctgcacaaga gccaccacac 12540 

acctcgcact ggaccctttg aagccaacga cttgtttgca atcatcaatg gactgcccgc 12600 

catgctcctg tgtacctttg gcttctggct gcccaacgtc ctgggggcgg cctgctttgg 12660 

agcggggctg ggcatcacgc tatacggcat ggcatatatg tttgtacacg atggcctggt 12720 

gcacaggcgc tttcccaccg ggcccatcgc tggcctgccc tacatgaagc gcctgacagt 12780 

ggcccaccag ctacaccaca gcggcaagta cggtggcgcg ccctggggta tgttcttggg 12840 

tccacaggag ctgcagcaca ttccaggtgc ggcggaggag gtggagcgac tggtcctgga 12900 

actggactgg tccaagcggt agaagcttgg cgtaatcatg gtcatagctg tttcctgtgt 12960 

gaaattgtta tccgctcaca attccacaca acatacgagc cggaagcata aagtgtaaag 13020 

cctggggtgc ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt 13080 
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tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag 13140 

gcggtttgcg tattgggcca aagacaaaag ggcgacattc aaccgattga gggagggaag 13200 

gtaaatattg acggaaatta ttcattaaag gtgaattatc accgtcaccg acttgagcca 13260 

tttgggaatt agagccagca aaatcaccag tagcaccatt accattagca aggccggaaa 13320 

cgtcaccaat gaaaccatcg atagcagcac cgtaatcagt agcgacagaa tcaagtttgc 13380 

ctttagcgtc agactgtagc gcgttttcat cggcattttc ggtcatagcc cccttattag 13440 

cgtttgccat cttttcataa tcaaaatcac cggaaccaga gccaccaccg gaaccgcctc 13 500 

cctcagagcc gccaccctca gaaccgccac cctcagagcc accaccctca gagccgccac 13560 

cagaaccacc accagagccg ccgccagcat tgacaggagg cccgatctag taacatagat 13 620 

gacaccgcgc gcgataattt atcctagttt gcgcgctata ttttgttttc tatcgcgtat 13680 

taaatgtata attgcgggac tctaatcata aaaacccatc tcataaataa cgtcatgcat 13740 

tacatgttaa ttattacatg cttaacgtaa ttcaacagaa attatatgat aatcatcgca 13800 

agaccggcaa caggattcaa tcttaagaaa ctttattgcc aaatgtttga acgatcgggg 13 860 

atcatccggg tctgtggcgg gaactccacg aaaatatccg aacgcagcaa gatatcgcgg 13920 

tgcatctcgg tcttgcctgg gcagtcgccg ccgacgccgt tgatgtggac gccgggcccg 13980 

atcatattgt cgctcaggat cgtggcgttg tgcttgtcgg ccgttgctgt cgtaatgata 14040 

tcggcacctt cgaccgcctg ttccgcagag atcccgtggg cgaagaactc cagcatgaga 14100 

tccccgcgct ggaggatcat ccagccggcg tcccggaaaa cgattccgaa gcccaacctt 14160 

tcatagaagg cggcggtgga atcgaaatct cgtgatggca ggttgggcgt cgcttggtcg 14220 

gtcatttcga accccagagt cccgctcaga agaactcgtc aagaaggcga tagaaggcga 14280 

tgcgctgcga atcgggagcg gcgataccgt aaagcacgag gaagcggtca gcccattcgc 14340 
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cgccaagctc ttcagcaata tcacgggtag ccaacgctat gtcctgatag cggtccgcca 14400 
cacccagccg gccacagtcg atgaatccag aaaagcggcc attttccacc atgatattcg 14460 
gcaagcaggc atcgccatgg gtcacgacga gatcatcgcc gtcgggcatg cgcgccttga 14520 
gcctggcgaa cagttcggct ggcgcgagcc cctgatgctc ttcgtccaga tcatcctgat 14580 
cgacaagacc ggcttccatc cgagtacgtg ctcgctcgat gcgatgtttc gcttggtggt - 14640 
cgaatgggca ggtagccgga tcaagcgtat gcagccgccg cattgcatca gccatgatgg 14700 
atactttctc ggcaggagca aggtgagatg acaggagatc ctgccccggc acttcgccca 147 60 
atagcagcca gtcccttccc gcttcagtga caacgtcgag cacagctgcg caaggaacgc 14820 
ccgtcgtggc cagccacgat agccgcgctg cctcgtcctg cagttcattc agggcaccgg 14880 
acaggtcggt cttgacaaaa agaaccgggc gcccctgcgc tgacagccgg aacacggcgg 14940 
catcagagca gccgattgtc tgttgtgccc agtcatagcc gaatagcctc tccacccaag 15000 
cggccggaga acctgcgtgc aatccatctt gttcaatcat gcgaaacgat ccagatccgg 15060 
tgcagattat ttggattgag agtgaatatg agactctaat tggataccga ggggaattta 15120 
tggaacgtca gtggagcatt tttgacaaga aatatttgct agctgatagt gaccttaggc 15180 
gacttttgaa cgcgcaataa tggtttctga cgtatgtgct tagctcatta aactccagaa 15240 
acccgcggct gagtggctcc ttcaacgttg cggttctgtc agttccaaac gtaaaacggc 15300 
ttgtcccgcg tcatcggcgg gggtcataac gtgactccct taattctccg ctcatgatca 15360 
gattgtcgtt tcccgccttc agtttaaact atcagtgttt gacaggatat attggcgggt 15420 
aaacctaaga gaaaagagcg tttattagaa taatcggata tttaaaaggg cgtgaaaagg 15480 
tttatccgtt cgtccatttg tatgtgcatg ccaaccacag ggttccccag atctggcgcc 15540 
ggccagcgag acgagcaaga ttggccgccg cccgaaacga tccgacagcg cgcccagcac 15600 
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aggtgcgcag gcaaattgca ccaacgcata cagcgccagc agaatgccat agtgggcggt 15660 

gacgtcgttc gagtgaacca gatcgcgcag gaggcccggc agcaccggca taatcaggcc 15720 

gatgccgaca gcgtcgagcg cgacagtgct cagaattacg atcaggggta tgttgggttt 15780 

cacgtctggc ctccggacca gcctccgctg gtccgattga acgcgcggat tctttatcac 15840 

tgataagttg gtggacatat tatgtttatc agtgataaag tgtcaagcat gacaaagttg 15900 

cagccgaata cagtgatccg tgccgccctg gacctgttga acgaggtcgg cgtagacggt 15960 

ctgacgacac gcaaactggc ggaacggttg ggggttcagc agccggcgct ttactggcac 16020 

ttcaggaaca agcgggcgct gctcgacgca ctggccgaag ccatgctggc ggagaatcat 16080 

acgcattcgg tgccgagagc cgacgacgac tggcgctcat ttctgatcgg gaatgcccgc 16140 
agcttcaggc aggcgctgct cgcctaccgc gatggcgcgc gcatccatgc cggcacgcga 16200 
ccgggcgcac cgcagatgga aacggccgac gcgcagcttc gcttcctctg cgaggcgggt 16260 
ttttcggccg gggacgccgt caatgcgctg atgacaatca gctacttcac tgttggggcc 16320 
gtgcttgagg agcaggccgg cgacagcgat gccggcgagc gcggcggcac cgttgaacag 16380 
gctccgctct cgccgctgtt gcgggccgcg atagacgcct tcgacgaagc cggtccggac 16440 
gcagcgttcg agcagggact cgcggtgatt gtcgatggat tggcgaaaag gaggctcgtt 16500 
gtcaggaacg ttgaaggacc gagaaagggt gacgattgat caggaccgct gccggagcgc 16560 
aacccactca ctacagcaga gccatgtaga caacatcccc tccccctttc caccgcgtca 16620 
gacgcccgta gcagcccgct acgggctttt tcatgccctg ccctagcgtc caagcctcac 16680 
ggccgcgctc ggcctctctg gcggccttct ggcgctcttc cgcttcctcg ctcactgact 16740 
cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac 16800 
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ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa 16860 

aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg 16920 

acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa 16980 

gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc 17040 

ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgcttttc cgctgcataa 17100 

ccctgcttcg gggtcattat agcgattttt tcggtatatc catccttttt cgcacgatat 17160 

acaggatttt gccaaagggt tcgtgtagac tttccttggt gtatccaacg gcgtcagccg 17220 

ggcaggatag gtgaagtagg cccacccgcg agcgggtgtt ccttcttcac tgtcccttat 17280 

tcgcacctgg cggtgctcaa cgggaatcct gctctgcgag gctggccggc taccgccggc 17340 

gtaacagatg agggcaagcg gatggctgat gaaaccaagc caaccaggaa gggcagccca 17400 

cctatcaagg tgtactgcct tccagacgaa cgaagagcga ttgaggaaaa ggcggcggcg 17460 

gccggcatga gcctgtcggc ctacctgctg gccgtcggcc agggctacaa aatcacgggc 17520 

gtcgtggact atgagcacgt ccgcgagctg gcccgcatca atggcgacct gggccgcctg 17580 

ggcggcctgc tgaaactctg gctcaccgac gacccgcgca cggcgcggtt cggtgatgcc 17640 

acgatcctcg ccctgctggc gaagatcgaa gagaagcagg acgagcttgg caaggtcatg 17700 
atgggcgtgg tccgcccgag ggcagagcca tgactttttt agccgctaaa acggccgggg 17760 
ggtgcgcgtg attgccaagc acgtccccat gcgctccatc aagaagagcg acttcgcgga 17820 

gctggtgaag tacatcaccg acgagcaagg caagaccgag cgcctttgcg acgctca 17877 

<210> 38 
<211> 17238 
<212> DNA 
<213> Artificial 
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<220> 

<223> Plasmid 



<220> 

<221> mis cofeature 

<222> (10264) . . (10264) 

<223> n is a, c, g, or t 



<220> 

<221> misc_feature 

<222> (10472) . . (10472) 

<223> n is a, c, g, or t 



<220> 

<221> misc__feature 

<222> (10563) . . (10563) 

<223> n is a, c, g, or t 



<400> 38 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 60 

aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 

aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480 

ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540 

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 



cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 



660 
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tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 

atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 

ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 

ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 

gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 

acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 

acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 

agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 

ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 1260 

ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 

atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 

agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 

agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 

cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 

ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 

gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 

gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 

tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 

ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 

tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 
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tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 

ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 

aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 

aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 

ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 

aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 

taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 

tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 

tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 

catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 

tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 

tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 

attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 

cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 

ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 

agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 

cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 

tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 

attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 

tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180 



WO 2004/063358 PCT/EP2004/000100 

113/358 



ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 

cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 

gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 

gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 

ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 

aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 

gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 

gtctcgaaca ggaggcggca -ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 

tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720 

agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 3780 

tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 

ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 

tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 

acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 

tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 

acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 

accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg 4200 

gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 4260 

gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 

ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 

gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 
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cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 

tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 

ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 

gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 

tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 

ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 

gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 

catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 

tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 

cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 

tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 

ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 

cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 

attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 

accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 

ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 

cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 

gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 

agcgggttta acctacttcc tttggtfcccg ggggatctcg cgactcgaac ctacagttgt 5580 

ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 
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cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 

tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 576.0 

tccagcgatt tec tat tat g teggcatagt tctcaagatc gaeagectgt cacggttaag 5820 

cgagaaatga ataagaaggc tgataattcg gatctctgeg agggagatga tatttgatca 5880 

caggcagcaa cgctctgtca tcgttacaat caacatgeta ccctccgcga gatcatccgt 5940 

gtttcaaacc eggcagctta gttgccgttc ttccgaatag categgtaac atgagcaaag 6000 

tctgccgcct tacaaegget ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 

cgagtggtga ttttgtgccg agetgeeggt eggggagctg ttggctggct ggtggcagga 6120 

tatattgtgg tgtaaacaaa ttgaegctta gacaacttaa taacacattg cggacgtttt 6180 

taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 

accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggega 6300 

aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 6360 

ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 

actccaacgt caaagggega aaaacegtet ateagggega tggcccacta cgtgaaccat 6480 

cacccaaatc aagttttttg gggtcgaggt geegtaaage actaaategg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa ageeggegaa cgtggcgaga aaggaaggga 6600 

agaaagegaa aggageggge gecattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 

cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 

tgggtaaege cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 

ctcggtaccc ggggatcttt cgacactgaa ataegtcgag cctgctccgc ttggaagcgg 6840 

egaggagect cgtcctgtca caactaccaa catggagtac gataagggee agttccgcca 6900 
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gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 

gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 

aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 

aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 

aagaactgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 

cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 

tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 

tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gtgaaccttt 7380 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 

tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 

gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 

tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 
tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7 680 
gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 
atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 
cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 
ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 
tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 7980 
cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 
accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactcfcttc 8100 
tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 
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acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 

cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 

agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 

gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 

atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 

gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 

ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 

cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 

tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 

aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 8760 

cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 

tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 
cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 
ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 
gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 
tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 
ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 
. accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 
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ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 

ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 

gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 

aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 

cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 

ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 

gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 

gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 

tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 

ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 

gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 

cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 10260 

cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt ttcgggagac 10320 

gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 

tccacgcgac tatatatttg tctctaattg tactttgaca tgctcctctt ctttactctg 10440 

atagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgcatgtt 10500 

tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 

canttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 

taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 
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atgcacaggt acacttgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 10740 
gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgcaagctt ctaccgcttg 10800 
gaccagtcca gttccaggac cagtcgctcc acctcctccg ccgcacctgg aatgtgctgc 10860 
agctcctgtg gacccaagaa cataccccag ggcgcgccac cgtacttgcc gctgtggtgt 10920 
agctggtggg ccactgtcag gcgcttcatg tagggcaggc cagcgatggg cccggtggga 10980 
aagcgcctgt gcaccaggcc atcgtgtaca aacatatatg ccatgccgta tagcgtgatg 11040 
cccagccccg ctccaaagca ggccgccccc aggacgttgg gcagccagaa gccaaaggta 11100 
cacaggagca tggcgggcag tccattgatg attgcaaaca agtcgttggc ttcaaagggt 11160 
ccagtgcgag gtgtgtggtg gctcttgtgc agcagccagc ccagaggcga ctcatgccag 11220 
atggctttgt gtgcatagcg ggcatacatc tccatgccga gcgcgccacc aaccaccaag 11280 
aggagagtgc cagccacttc accccatggc actgcgccgc ccacggtcat gtgcatggca 11340 
aatctcaggt aggtggcgaa gatggcaatg cctgacacgc caattgatgc tgcaatggcg 11400 
gcagcctggt atgacagctg ctcccgtttg cgccgggcac gacgctctgc gatagcccgg 11460 
tcaagctgct ggagtgctac atcggcgctg tgctcatcgc ccgcgccggc agcctgcacg 11520 
gttcccagcg cctcctctgt ctgtggtgct gccactcgca gccgaactaa cgagcaccgc 11580 
tgagcatgca ggcagacttt gggccgcgtg atgtcgcggg ctagttcaac gcggcgggcc 11640 
ttgacgctga ttgactgcag cttcgacagc atagagataa aataaaaaga gaagaaaaga 11700 
aagtttgtac aatttctttt tgtttatata acatacacgc tatgtcaaca tttagaataa 11760 
gggggaaaaa atcttccatc atattcgaat gcacaagatt atttctttgt tcgctctttt 11820 
tggtcgggtc atcgagattt agagtgtaat caaagatact gtcatctcga gagcgttgca 11880 
caggctgctg tttgccaaat tggatgtttg ccgaattagt aaaatacgca agcatttctt 11940 
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acctttccgc tcccttttcc taattctccc aaagactaaa tgaggaaaga taaaggacaa 12 000 

agaaaatgta aagacaaaga aattgaaaac gatataaact tgcagcacgt aagaccaaag 12060 

caaattggta actattcttg tgtacaaaca tgtataaaaa aaaacttttt tttgctcctg 12120 

gaggacaaaa tttcaaactc cttgaagaag attgcttgta tatctatcat atgcatatat 12180 

catatcgatg gaaaaagaaa gtcaggcatg tatttataaa aagaagaatg tgccatgctt 12240 

ccgaatttct tttcactttc ttttccttat ctattttaat ctcaagcttg gcgtaatcat 12300 

ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag 12360 

ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg 12420 

cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 12480 

tcggccaacg cgcggggaga ggcggtttgc gtattgggcc aaagacaaaa gggcgacatt 12540 

caaccgattg agggagggaa ggtaaatatt gacggaaatt attcattaaa ggtgaattat 12600 

caccgtcacc gacttgagcc atttgggaat tagagccagc aaaatcacca gtagcaccat 12660 

taccattagc aaggccggaa acgtcaccaa tgaaaccatc gatagcagca ccgtaatcag 12720 

tagcgacaga atcaagtttg cctttagcgt cagactgtag cgcgttttca tcggcatttt 12780 

cggtcatagc ccccttatta gcgtttgcca tcttttcata atcaaaatca ccggaaccag 12840 

agccaccacc ggaaccgcct ccctcagagc cgccaccctc agaaccgcca ccctcagagc 12900 

caccaccctc agagccgcca ccagaaccac caccagagcc gccgccagca ttgacaggag 12960 

gcccgatcta gtaacataga tgacaccgcg cgcgataatt tatcctagtt tgcgcgctat 13020 

attttgtttt ctatcgcgta ttaaatgtat aattgcggga ctctaatcat aaaaacccat 13080 

ctcataaata acgtcatgca ttacatgtta attattacat gcttaacgta attcaacaga 13140 
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aattatatga taatcatcgc aagaccggca acaggattca atcttaagaa actttattgc 13200 
caaatgtttg aacgatcggg gatcatccgg gtctgtggcg ggaactccac gaaaatatcc 13260 
gaacgcagca agatatcgcg gtgcatctcg gtcttgcctg ggcagtcgcc gccgacgccg 13320 
ttgatgtgga cgccgggccc gatcatattg tcgctcagga tcgtggcgtt gtgcttgtcg 13380 
gccgttgctg tcgtaatgat atcggcacct tcgaccgcct gttccgcaga gatcccgtgg 13440 
gcgaagaact ccagcatgag atccccgcgc tggaggatca tccagccggc gtcccggaaa 13500 
acgattccga agcccaacct ttcatagaag gcggcggtgg aatcgaaatc tcgtgatggc 13560 
aggttgggcg tcgcttggtc ggtcatttcg aaccccagag tcccgctcag aagaactcgt 13620 
caagaaggcg atagaaggcg atgcgctgcg aatcgggagc ggcgataccg taaagcacga 13 680 
ggaagcggtc agcccattcg ccgccaagct cttcagcaat atcacgggta gccaacgcta 13740 
tgtcctgata gcggtccgcc acacccagcc ggccacagtc gatgaatcca gaaaagcggc 13800 
cattttccac catgatattc ggcaagcagg catcgccatg ggtcacgacg agatcatcgc 13860 
cgtcgggcat gcgcgccttg agcctggcga acagttcggc tggcgcgagc ccctgatgct 13920 
cttcgtccag atcatcctga tcgacaagac cggcttccat ccgagtacgt gctcgctcga 13980 
tgcgatgttt cgcttggtgg tcgaatgggc aggtagccgg atcaagcgta tgcagccgcc 14040 
gcattgcatc agccatgatg gatactttct cggcaggagc aaggtgagat gacaggagat 14100 
cctgccccgg cacttcgccc aatagcagcc agtcccttcc cgcttcagtg acaacgtcga 14160 
gcacagctgc gcaaggaacg cccgtcgtgg ccagccacga tagccgcgct gcctcgtcct 14220 
gcagttcatt cagggcaccg gacaggtcgg tcttgacaaa aagaaccggg cgcccctgcg 14280 
ctgacagccg gaacacggcg gcatcagagc agccgattgt ctgttgtgcc cagtcatagc 14340 
cgaatagcct ctccacccaa gcggccggag aacctgcgtg caatccatct tgttcaatca 14400 
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tgcgaaacga tccagatccg gtgcagatta tttggattga gagtgaatat gagactctaa 14460 

ttggataccg aggggaattt atggaacgtc agtggagcat ttttgacaag aaatatttgc 14520 

tagctgatag tgaccttagg cgacttttga acgcgcaata atggtttctg acgtatgtgc 14580 

ttagctcatt aaactccaga aacccgcggc tgagtggctc cttcaacgtt gcggttctgt 14640 

cagttccaaa cgtaaaacgg cttgtcccgc gtcatcggcg ggggtcataa cgtgactccc 14700 

ttaattctcc gctcatgatc agattgtcgt ttcccgcctt cagtttaaac tatcagtgtt 14760 

tgacaggata tattggcggg taaacctaag agaaaagagc gtttattaga ataatcggat 14820 

atttaaaagg gcgtgaaaag gtttatccgt tcgtccattt gtatgtgcat gccaaccaca 14880 

gggttcccca gatctggcgc cggccagcga gacgagcaag attggccgcc gcccgaaacg 14940 

atccgacagc gcgcccagca caggtgcgca ggcaaattgc accaacgcat acagcgccag 15000 

cagaatgcca tagtgggcgg tgacgtcgtt cgagtgaacc agatcgcgca ggaggcccgg 15060 

cagcaccggc ataatcaggc cgatgccgac agcgtcgagc gcgacagtgc tcagaattac 15120 

gatcaggggt atgttgggtt tcacgtctgg cctccggacc agcctccgct ggtccgattg 15180 

aacgcgcgga ttctttatca ctgataagtt ggtggacata ttatgtttat cagtgataaa 15240 

gtgtcaagca tgacaaagtt gcagccgaat acagtgatcc gtgccgccct ggacctgttg 15300 

aacgaggtcg gcgtagacgg tctgacgaca cgcaaactgg cggaacggtt gggggttcag 15360 

cagccggcgc tttactggca cttcaggaac aagcgggcgc tgctcgacgc actggccgaa 15420 

gccatgctgg cggagaatca tacgcattcg gtgccgagag ccgacgacga ctggcgctca 15480 

tttctgatcg ggaatgcccg cagcttcagg caggcgctgc tcgcctaccg cgatggcgcg 15540 

cgcatccatg ccggcacgcg accgggcgca ccgcagatgg aaacggccga cgcgcagctt 15600 

cgcttcctct gcgaggcggg tttttcggcc ggggacgccg tcaatgcgct gatgacaatc 15660 
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agctacttca ctgttggggc cgtgcttgag gagcaggccg gcgacagcga tgccggcgag 15720 

cgcggcggca ccgttgaaca ggctccgctc tcgccgctgt tgcgggccgc gatagacgcc 15780 

ttcgacgaag ccggtccgga cgcagcgttc gagcagggac tcgcggtgat tgtcgatgga 15840 

ttggcgaaaa ggaggctcgt tgtcaggaac gttgaaggac cgagaaaggg tgacgattga 15900 

tcaggaccgc tgccggagcg caacccactc actacagcag agccatgtag acaacatccc 15960 

ctcccccttt ccaccgcgtc agacgcccgt agcagcccgc tacgggcttt ttcatgccct 16020 

gccctagcgt ccaagcctca cggccgcgct cggcctctct ggcggccttc tggcgctctt 16080 

ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 16140 

ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 16200 

tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 16260 

tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 16320 

gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 16380 

ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg i6440 

tggcgctttt ccgctgcata accctgcttc ggggtcatta tagcgatttt ttcggtatat 16500 

ccatcctttt tcgcacgata tacaggattt tgccaaaggg ttcgtgtaga ctttccttgg 16560 

tgtatccaac ggcgtcagcc gggcaggata ggtgaagtag gcccacccgc gagcgggtgt 16620 

tccttcttca ctgtccctta ttcgcacctg gcggtgctca acgggaatcc tgctctgcga 16680 

ggctggccgg ctaccgccgg cgtaacagat gagggcaagc ggatggctga tgaaaccaag 16740 

ccaaccagga agggcagccc acctatcaag gtgtactgcc ttccagacga acgaagagcg 16800 

attgaggaaa aggcggcggc ggccggcatg agcctgtcgg cctacctgct ggccgtcggc 16860 

cagggctaca aaatcacggg cgtcgtggac tatgagcacg tccgcgagct ggcccgcatc 16920 
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aatggcgacc tgggccgcct gggcggcctg ctgaaactct ggctcaccga cgacccgcgc 16980 

acggcgcggt tcggtgatgc cacgatcctc gccctgctgg cgaagatcga agagaagcag 17040 

gacgagcttg gcaaggtcat gatgggcgtg gtccgcccga gggcagagcc atgacttttt 17100 

tagccgctaa aacggccggg gggtgcgcgt gattgccaag cacgtcccca tgcgctccat 17160 

caagaagagc gacttcgcgg agctggtgaa gtacatcacc gacgagcaag gcaagaccga 17220 

gcgcctttgc gacgctca 17238 



<210> 39 

<211> 17238 

<212> DNA 

<213> Artificial 

<220> 

<223> Plasmid 



<220> 

<221> misc_f eature 

<222> (10264) . . (10264) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (10472) . . (10472) 

<223> n is a, c, g, or t 

<220> 

<221> misc_f eature 

<222> (10563) . . (10563) 

<223> n is a, c, g, or t 

<400> 39 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 60 
aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 
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aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480 

ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540 

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 

cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 660 

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 

atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 

ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 

ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 

gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 

acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 

acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 

agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 

ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 1260 

ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 

atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 
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agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 

agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 

cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 

ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 

gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 

gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 

tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 

ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 

tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 

tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 

ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 

aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 

aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 

ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 

aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 

taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 

tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 

tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 

catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 

tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 
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tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 

attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 

cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 

ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 

agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 

cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3 000 

tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 

attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 

tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180 

ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 

cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 

gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 

gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 342 0 

ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 

aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 

gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 

gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 

tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720 

agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 3780 

tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 
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ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 

tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 

acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 

tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 

acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 

accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg 4200 

gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 4260 

gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 

ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 

gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 

cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 

tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 

ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 

gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 

tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 

ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 

gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 

catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 

tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 

cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 

tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 
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ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 

cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 

attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 

accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 

ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 

cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 

gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 

agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 

ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 

cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 

tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 5760 

tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 5820 

cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca 5880 

caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 5940 

gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000 

tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 

cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 

tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 

taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 

accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 6300 
aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 6360 



WO 2004/063358 PCT/EP2004/000100 

130/358 



ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 

actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 

cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 

agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 

cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 

tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 

ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 

cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 

gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 

gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 

aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 

aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 

aagaactgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 

cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 72 60 

tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 

tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gtgaaccttt 7380 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 

tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 

gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 

tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 
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tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 

gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 

atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 

cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 

ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 

tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 7980 

cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 

accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 

tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 

acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 

cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 

agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 

gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 

atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 

gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 

ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 

cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 

tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 

aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 8760 

cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 

tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 
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tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 

ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 

gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 

tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 

ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 

accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 

ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 

ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 

gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 

aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 

cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 

ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 

gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 

gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 

tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 
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ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 

gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 

cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 10260 

cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt ttcgggagac 10320 

gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 

tccacgcgac tatatatttg tctctaattg tactttgaca tgctcctctt ctttactctg 10440 

atagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgcatgtt 10500 

tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 

canttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 

taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 

atgcacaggt acacttgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 10740 

gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgcaagctt agagataaaa 10800 

taaaaagaga agaaaagaaa gtttgtacaa tttctttttg tttatataac atacacgcta 10860 

tgtcaacatt tagaataagg gggaaaaaat cttccatcat attcgaatgc acaagattat 10920 

ttctttgttc gctctttttg gtcgggtcat cgagatttag agtgtaatca aagatactgt 10980 

catctcgaga gcgttgcaca ggctgctgtt tgccaaattg gatgtttgcc gaattagtaa 11040 

aatacgcaag catttcttac ctttccgctc ccttttccta attctcccaa agactaaatg 11100 

aggaaagata aaggacaaag aaaatgtaaa gacaaagaaa ttgaaaacga tataaacttg 11160 

cagcacgtaa gaccaaagca aattggtaac tattcttgtg tacaaacatg tataaaaaaa 11220 

aacttttttt tgctcctgga ggacaaaatt tcaaactcct tgaagaagat tgcttgtata 11280 

tctatcatat gcatatatca tatcgatgga aaaagaaagt caggcatgta tttataaaaa 11340 
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gaagaatgtg ccatgcttcc gaatttcttt tcactttctt ttccttatct attttaatct 11400 
catgctgtcg aagctgcagt caatcagcgt caaggcccgc cgcgttgaac tagcccgcga 11460 
catcacgcgg cccaaagtct gcctgcatgc tcagcggtgc tcgttagttc ggctgcgagt 11520 
ggcagcacca cagacagagg aggcgctggg aaccgtgcag gctgccggcg cgggcgatga 11580 
gcacagcgcc gatgtagcac tccagcagct tgaccgggct atcgcagagc gtcgtgcccg 11640 
gcgcaaacgg gagcagctgt cataccaggc tgccgccatt gcagcatcaa ttggcgtgtc 11700 
aggcattgcc atcttcgcca cctacctgag atttgccatg cacatgaccg tgggcggcgc 11760 
agtgccatgg ggtgaagtgg ctggcactct cctcttggtg gttggtggcg cgctcggcat 11820 
ggagatgtat gcccgctatg cacacaaagc catctggcat gagtcgcctc tgggctggct 11880 
gctgcacaag agccaccaca cacctcgcac tggacccttt gaagccaacg acttgtttgc 11940 
aatcatcaat ggactgcccg ccatgctcct gtgtaccttt ggcttctggc tgcccaacgt 12000 
cctgggggcg gcctgctttg gagcggggct gggcatcacg ctatacggca tggcatatat 12060 
gtttgtacac gatggcctgg tgcacaggcg ctttcccacc gggcccatcg ctggcctgcc 12120 
ctacatgaag cgcctgacag tggcccacca gctacaccac agcggcaagt acggtggcgc 12180 
gccctggggt atgttcttgg gtccacagga gctgcagcac attccaggtg cggcggagga 12240 
ggtggagcga ctggtcctgg aactggactg gtccaagcgg tagaagcttg gcgtaatcat 12300 
ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag 12360 
ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg 12420 
cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 12480 
tcggccaacg cgcggggaga ggcggtttgc gtattgggcc aaagacaaaa gggcgacatt 12540 
caaccgattg agggagggaa ggtaaatatt gacggaaatt attcattaaa ggtgaattat 12600 
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caccgtcacc gacttgagcc atttgggaat tagagccagc aaaatcacca gtagcaccat 12660 

taccattagc aaggccggaa acgtcaccaa tgaaaccatc gatagcagca ccgtaatcag 12720 

tagcgacaga atcaagtttg cctttagcgt cagactgtag cgcgttttca tcggcatttt 12780 

cggtcatagc ccccttatta gcgtttgcca tcttttcata atcaaaatca ccggaaccag 12840 

agccaccacc ggaaccgcct ccctcagagc cgccaccctc agaaccgcca ccctcagagc 12900 

caccaccctc agagccgcca ccagaaccac caccagagcc gccgccagca ttgacaggag 12960 

gcccgatcta gtaacataga tgacaccgcg cgcgataatt tatcctagtt tgcgcgctat 13020 

attttgtttt ctatcgcgta ttaaatgtat aattgcggga ctctaatcat aaaaacccat 13080 

ctcataaata acgtcatgca ttacatgtta attattacat gcttaacgta attcaacaga 13140 

aattatatga taatcatcgc aagaccggca acaggattca atcttaagaa actttattgc 13200 

caaatgtttg aacgatcggg gatcatccgg gtctgtggcg ggaactccac gaaaatatcc 13260 

gaacgcagca agatatcgcg gtgcatctcg gtcttgcctg ggcagtcgcc gccgacgccg 13320 

ttgatgtgga cgccgggccc gatcatattg tcgctcagga tcgtggcgtt gtgcttgtcg 13380 

gccgttgctg tcgtaatgat atcggcacct tcgaccgcct gttccgcaga gatcccgtgg 13440 

gcgaagaact ccagcatgag atccccgcgc tggaggatca tccagccggc gtcccggaaa 13500 

acgattccga agcccaacct ttcatagaag gcggcggtgg aatcgaaatc tcgtgatggc 13560 

aggttgggcg tcgcttggtc ggtcatttcg aaccccagag tcccgctcag aagaactcgt 13620 

caagaaggcg atagaaggcg atgcgctgcg aatcgggagc ggcgataccg taaagcacga 13680 

ggaagcggtc agcccattcg ccgccaagct cttcagcaat atcacgggta gccaacgcta 13740 

tgtcctgata gcggtccgcc acacccagcc ggccacagtc gatgaatcca gaaaagcggc 13800 

cattttccac catgatattc ggcaagcagg catcgccatg ggtcacgacg agatcatcgc 13860 
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cgtcgggcat gcgcgccttg agcctggcga acagttcggc tggcgcgagc ccctgatgct 13920 
cttcgtccag atcatcctga tcgacaagac cggcttccat ccgagtacgt gctcgctcga 13980 
tgcgatgttt cgcttggtgg tcgaatgggc aggtagccgg atcaagcgta tgcagccgcc 14040 
gcattgcatc agccatgatg gatactttct cggcaggagc aaggtgagat gacaggagat 14100 
cctgccccgg cacttcgccc aatagcagcc agtcccttcc cgcttcagtg acaacgtcga 14160 
gcacagctgc gcaaggaacg cccgtcgtgg ccagccacga tagccgcgct gcctcgtcct 14220 
gcagttcatt cagggcaccg gacaggtcgg tcttgacaaa aagaaccggg cgcccctgcg 14280 
ctgacagccg gaacacggcg gcatcagagc agccgattgt ctgttgtgcc cagtcatagc 14340 
cgaatagcct ctccacccaa gcggccggag aacctgcgtg caatccatct tgttcaatca 14400 
tgcgaaacga tccagatccg gtgcagatta tttggattga gagtgaatat gagactctaa 14460 
ttggataccg aggggaattt atggaacgtc agtggagcat ttttgacaag aaatatttgc 14520 
tagctgatag tgaccttagg cgacttttga acgcgcaata atggtttctg acgtatgtgc 14580 
ttagctcatt aaactccaga aacccgcggc tgagtggctc cttcaacgtt gcggttctgt 14640 
cagttccaaa cgtaaaacgg cttgtcccgc gtcatcggcg ggggtcataa cgtgactccc 14700 
ttaattctcc gctcatgatc agattgtcgt ttcccgcctt cagtttaaac tatcagtgtt 14760 
tgacaggata tattggcggg taaacctaag agaaaagagc gtttattaga ataatcggat 14820 
atttaaaagg gcgtgaaaag gtttatccgt tcgtccattt gtatgtgcat gccaaccaca 14880 
gggttcccca gatctggcgc cggccagcga gacgagcaag attggccgcc gcccgaaacg 14940 
atccgacagc gcgcccagca caggtgcgca ggcaaattgc accaacgcat acagcgccag 15000 
cagaatgcca tagtgggcgg tgacgtcgtt cgagtgaacc agatcgcgca ggaggcccgg 15060 
cagcaccggc ataatcaggc cgatgccgac agcgtcgagc gcgacagtgc tcagaattac 15120 
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gatcaggggt atgttgggtt tcacgtctgg cctccggacc agcctccgct ggtccgattg 15180 

aacgcgcgga ttctttatca ctgataagtt ggtggacata ttatgtttat cagtgataaa 15240 

gtgtcaagca tgacaaagtt gcagccgaat acagtgatcc gtgccgccct ggacctgttg 15300 

aacgaggtcg gcgtagacgg tctgacgaca cgcaaactgg cggaacggtt gggggttcag 15360 

cagccggcgc tttactggca cttcaggaac aagcgggcgc tgctcgacgc actggccgaa 15420 

gccatgctgg cggagaatca tacgcattcg gtgccgagag ccgacgacga ctggcgctca 15480 

tttctgatcg ggaatgcccg cagcttcagg caggcgctgc tcgcctaccg cgatggcgcg 15540 

cgcatccatg ccggcacgcg accgggcgca cpgcagatgg aaacggccga cgcgcagctt 15600 

cgcttcctct gcgaggcggg tttttcggcc ggggacgccg tcaatgcgct gatgacaatc 15660 

agctacttca ctgttggggc cgtgcttgag gagcaggccg gcgacagcga tgccggcgag 15720 

cgcggcggca ccgttgaaca ggctccgctc tcgccgctgt tgcgggccgc gatagacgcc 15780 

ttcgacgaag ccggtccgga cgcagcgttc gagcagggac tcgcggtgat tgtcgatgga 15840 

ttggcgaaaa ggaggctcgt tgtcaggaac gttgaaggac cgagaaaggg tgacgattga 15900 

tcaggaccgc tgccggagcg caacccactc actacagcag agccatgtag acaacatccc 15960 

ctcccccttt ccaccgcgtc agacgcccgt agcagcccgc tacgggcttt ttcatgccct 16020 

gccctagcgt ccaagcctca cggccgcgct cggcctctct ggcggccttc tggcgctctt 16080 

ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 16140 

ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 16200 

tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 16260 

tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 16320 

gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 16380 
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ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 16440 

tggcgctttt ccgctgcata accctgcttc ggggtcatta tagcgatttt ttcggtatat 16500 

ccatcctttt tcgcacgata tacaggattt tgccaaaggg ttcgtgtaga ctttccttgg 16560 

tgtatccaac ggcgtcagcc gggcaggata ggtgaagtag gcccacccgc gagcgggtgt 16620 

tccttcttca ctgtccctta ttcgcacctg gcggtgctca acgggaatcc tgctctgcga 16680 

ggctggccgg ctaccgccgg cgtaacagat gagggcaagc ggatggctga tgaaaccaag 16740 

ccaaccagga agggcagccc acctatcaag gtgtactgcc ttccagacga acgaagagcg 16800 

attgaggaaa aggcggcggc ggccggcatg agcctgtcgg cctacctgct ggccgtcggc 16860 

cagggctaca aaatcacggg cgtcgtggac tatgagcacg tccgcgagct ggcccgcatc 16920 

aatggcgacc tgggccgcct gggcggcctg ctgaaactct ggctcaccga cgacccgcgc 16980 

acggcgcggt tcggtgatgc cacgatcctc gccctgctgg cgaagatcga agagaagcag 17040 

gacgagcttg gcaaggtcat gatgggcgtg gtccgcccga gggcagagcc atgacttttt 17100 

tagccgctaa aacggccggg gggtgcgcgt gattgccaag cacgtcccca tgcgctccat 17160 

caagaagagc gacttcgcgg agctggtgaa gtacatcacc gacgagcaag gcaagaccga 17220 

gcgcctttgc gacgctca 17238 
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<220> 

<221> misc — feature 
<222> (3471) . . (3471) 
<223> n is a, c, g, or t 

<220> 

<221> misc_ feature 

<222> (3679) . . (3679) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (3770) . . (3770) 

<223> n is a, c, g, or t 

<400> 40 

gatctttcga cactgaaata cgtcgagcct gctccgcttg gaagcggcga ggagcctcgt 60 

cctgtcacaa ctaccaacat ggagtacgat aagggccagt tccgccagct cattaagagc 120 

cagttcatgg gcgttggcat gatggccgtc atgcatctgt acttcaagta caccaacgct 180 

cttctgatcc agtcgatcat ccgctgaagg cgctttcgaa tctggttaag atccacgtct 240 

tcgggaagcc agcgactggt gacctccagc gtccctttaa ggctgccaac agctttctca 300 

gccagggcca gcccaagacc gacaaggcct ccctccagaa cgccgagaag aactggaggg 360 

gtggtgtcaa ggaggagtaa gctccttatt gaagtcggag gacggagcgg tgtcaagagg 420 

atattcttcg actctgtatt atagataaga tgatgaggaa ttggaggtag catagcttca 480 

• tttggatttg ctttccaggc tgagactcta gcttggagca tagagggtcc tttggctttc 540 

aatattctca agtatctcga gtttgaactt attccctgtg aaccttttat tcaccaatga 600 

gcattggaat gaacatgaat ctgaggactg caatcgccat gaggttttcg aaatacatcc 660 

ggatgtcgaa ggcttggggc acctgcgttg gttgaattta gaacgtggca ctattgatca 720 

tccgatagct ctgcaaaggg cgttgcacaa tgcaagtcaa acgttgctag cagttccagg 780 
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tggaatgtta tgatgagcat tgtattaaat caggagatat agcatgatct ctagttagct 840 

caccacaaaa gtcagacggc gtaaccaaaa gtcacacaac acaagctgta aggatttcgg 900 
cacggctacg gaagacggag aagccacctt cagtggactc gagtaccatt taattctatt 960 

tgtgtttgat cgagacctaa tacagcccct acaacgacca tcaaagtcgt atagctacca 1020 

gtgaggaagt ggactcaaat cgacttcagc aacatctcct ggataaactt taagcctaaa 1080 

ctatacagaa taagataggt ggagagctta taccgagctc ccaaatctgt ccagatcatg 1140 

gttgaccggt gcctggatct tcctatagaa tcatccttat tcgttgacct agctgattct 1200 

ggagtgaccc agagggtcat gacttgagcc taaaatccgc cgcctccacc atttgtagaa 1260 

aaatgtgacg aactcgtgag ctctgtacag tgaccggtga ctctttctgg catgcggaga 1320 

gacggacgga cgcagagaga agggctgagt aataagccac tggccagaca gctctggcgg 1380 

ctctgaggtg cagtggatga ttattaatcc gggaccggcc gcccctccgc cccgaagtgg 1440 

aaaggctggt gtgcccctcg ttgaccaaga atctattgca tcatcggaga atatggagct 1500 

tcatcgaatc accggcagta agcgaaggag aatgtgaagc caggggtgta tagccgtcgg 1560 

cgaaatagca tgccattaac ctaggtacag aagtccaatt gcttccgatc tggtaaaaga 1620 
ttcacgagat agtaccttct ccgaagtagg tagagcgagt acccggcgcg taagctccct 1680 
aattggccca tccggcatct gtagggcgtc caaatatcgt gcctctcctg ctttgcccgg 1740 
tgtatgaaac cggaaaggcc gctcaggagc tggccagcgg cgcagaccgg gaacacaagc 1800 
tggcagtcga cccatccggt gctctgcact cgacctgctg aggtccctca gtccctggta 1860 
ggcagctttg ccccgtctgt ccgcccggtg tgtcggcggg gttgacaagg tcgttgcgtc 1920 
agtccaacat ttgttgccat attttcctgc tctccccacc agctgctctt ttcttttctc 1980 
tttcttttcc catcttcagt atattcatct tcccatccaa gaacctttat ttcccctaag 2040 
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taagtacttt gctacatcca tactccatcc ttcccatccc ttattccttt gaacctttca 2100 

gttcgagctt tcccacttca tcgcagcttg actaacagct accccgcttg agcagacatc 2160 

accatgcctg aactcaccgc gacgtctgtc gagaagtttc tgatcgaaaa gttcgacagc 2220 

gtctccgacc tgatgcagct ctcggagggc gaagaatctc gtgctttcag cttcgatgta 2280 

ggagggcgtg gatatgtcct gcgggtaaat agctgcgccg atggtttcta caaagatcgt 2340 

tatgtttatc ggcactttgc atcggccgcg ctcccgattc cggaagtgct tgacattggg 2400 

gaattcagcg agagcctgac ctattgcatc tcccgccgtg cacagggtgt cacgttgcaa 2460 

gacctgcctg aaaccgaact gcccgctgtt ctgcagccgg tcgcggaggc catggatgcg 2520 

atcgctgcgg ccgatcttag ccagacgagc gggttcggcc cattcggacc gcaaggaatc 2580 

ggtcaataca ctacatggcg tgatttcata tgcgcgattg ctgatcccca tgtgtatcac 2640 

tggcaaactg tgatggacga caccgtcagt gcgtccgtcg cgcaggctct cgatgagctg 2700 

atgctttggg ccgaggactg ccccgaagtc cggcacctcg tgcacgcgga tttcggctcc 2760 

aacaatgtcc tgacggacaa tggccgcata acagcggtca ttgactggag cgaggcgatg. 2820 

ttcggggatt cccaatacga ggtcgccaac atcttcttct ggaggccgtg gttggcttgt 2880 

atggagcagc agacgcgcta cttcgagcgg aggcatccgg agcttgcagg atcgccgcgg 2940 

ctccgggcgt atatgctccg cattggtctt gaccaactct atcagagctt ggttgacggc 3000 

aatttcgatg atgcagcttg ggcgcagggt cgatgcgacg caatcgtccg atccggagcc 3060 

gggactgtcg ggcgtacaca aatcgcccgc agaagcgcgg ccgtctggac cgatggctgt 3120 

gtagaagtac tcgccgatag tggaaaccga cgccccagca ctcgtccgag ggcaaaggaa 3180 

tagagtagat gccgaccgcg ggatcgatcc acttaacgtt actgaaatca tcaaacagct 3240 

tgacgaatct ggatataaga tcgttggtgt cgatgtcagc tccggagttg agacaaatgg 3300 
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tgttcaggat ctcgataaga tacgttcatt tgtccaagca gcaaagagtg ccttctagtg 33 60 

atttaatagc tccatgtcaa caagaataaa acgcgttttc gggtttacct cttccagata 3420 

cagctcatct gcaatgcatt aatgcattga ctgcaaccta gtaacgcctt ncaggctccg 3480 

gcgaagagaa gaatagctta gcagagctat tttcattttc gggagacgag atcaagcaga 3540 

tcaacggtcg tcaagagacc tacgagactg aggaatccgc tcttggctcc acgcgactat 3600 

atatttgtct ctaattgtac tttgacatgc tcctcttctt tactctgata gcttgactat 3660 

gaaaattccg tcaccagcnc ctgggttcgc aaagataatt gcatgtttct tccttgaact 372 0 

ctcaagccta caggacacac attcatcgta ggtataaacc tcgaaatcan ttcctactaa 3780 

gatggtatac aatagtaacc atgcatggtt gcctagtgaa tgctccgtaa cacccaatac 3840 

gccggccgaa acttttttac aactctccta tgagtcgttt acccagaatg cacaggtaca 3900 

cttgtttaga ggtaatcctt ctttctagct agaagtcctc gtgtactgtg taagcgccca 3960 

ctccacatct ccactcgacc tgcaggcatg caaagcttga gattaaaata gataaggaaa 4020 

agaaagtgaa aagaaattcg gaagcatggc acattcttct ttttataaat acatgcctga 4080 

ctttcttttt ccatcgatat gatatatgca tatgatagat atacaagcaa tcttcttcaa 4140 

ggagtttgaa attttgtcct ccaggagcaa aaaaaagttt ttttttatac atgtttgtac 4200 

acaagaatag ttaccaattt gctttggtct tacgtgctgc aagtttatat cgttttcaat 4260 

ttctttgtct ttacattttc tttgtccttt atctttcctc atttagtctt tgggagaatt 4320 

aggaaaaggg agcggaaagg taagaaatgc ttgcgtattt tactaattcg gcaaacatcc 4380 

aatttggcaa acagcagcct gtgcaacgct ctcgagatga cagtatcttt gattacactc 4440 

taaatctcga tgacccgacc aaaaagagcg aacaaagaaa taatcttgtg cattcgaata 4500 

tgatggaaga ttttttcccc cttattctaa atgttgacat agcgtgtatg ttatataaac 4560 
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aaaaagaaat tgtacaaact ttcttttctt ctctttttat tttatctcta tgctgtcgaa 4620 

gctgcagtca atcagcgtca aggcccgccg cgttgaacta gcccgcgaca tcacgcggcc 4680 

caaagtctgc ctgcatgctc agcggtgctc gttagttcgg ctgcgagtgg cagcaccaca 4740 

gacagaggag gcgctgggaa ccgtgcaggc tgccggcgcg ggcgatgagc acagcgccga 4800 

tgtagcactc cagcagcttg accgggctat cgcagagcgt cgtgcccggc gcaaacggga 4860 

gcagctgtca taccaggctg ccgccattgc agcatcaatt ggcgtgtcag gcattgccat 4920 

cttcgccacc tacctgagat ttgccatgca catgaccgtg ggcggcgcag tgccatgggg 4980 

tgaagtggct ggcactctcc tcttggtggt tggtggcgcg ctcggcatgg agatgtatgc 5040 

ccgctatgca cacaaagcca tctggcatga gtcgcctctg ggctggctgc tgcacaagag 5100 

ccaccacaca cctcgcactg gaccctttga agccaacgac ttgtttgcaa tcatcaatgg 5160 

actgcccgcc atgctcctgt gtacctttgg cttctggctg cccaacgtcc tgggggcggc 5220 

ctgctttgga gcggggctgg gcatcacgct atacggcatg gcatatatgt ttgtacacga 5280 

tggcctggtg cacaggcgct ttcccaccgg gcccatcgct ggcctgccct acatgaagcg 5340 

cctgacagtg gcccaccagc tacaccacag cggcaagtac ggtggcgcgc cctggggtat 5400 

gttcttgggt ccacaggagc tgcagcacat tccaggtgcg gcggaggagg tggagcgact 5460 

ggtcctggaa ctggactggt ccaagcggta gattgtgact gatagcgaga ctctgggtcg 5520 

atgttatctg cctcaacaat ggcttagaaa agaagaaaca gaacaaatac agcaaggcaa 5580 

cgcccgtagc ctaggtgatc aaagactgtt gggcttgtct ctgaagcttg taggaaaggc 5640 

agacgctatc atggtgagag ctaagaaggg cattgacaag ttgccggcaa actgtcaagg 5700 

cggtgtacga gctgcttgcc aagtatatgc tgcaattgga tctgtactca agcagcagaa 5760 

gacaacatat cctacaagag ctcatctaaa aggaagcgaa cgtgccaaga ttgctctgtt 5820 
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gagtgtatac aacctctatc aatctgaaga caagcctgtg gctctccgtc aagctagaaa 5880 

gattaagagt ttttttgttg attagtgaat ttttgtttta tttatgtctg atagttcaat 5940 

aaagagacaa cacatacaat ataaaatcat tgtctttaaa tgttaattta gtagagtgta 6000 

aagcctgcat tttttttgta cgcataaaca atgaattcac cccgcttctg gtttttaaat 6060 

aattatgtca aactagggaa aattcttttt tttctcttcg ttcttttttt ggcttgttgt 6120 

ggagtcacag gcttgtcttc agattgatag aggttgtata cactcaacag agcaatcttg 6180 

gcacgttcgc ttccttttag atgagctctt gtaggatatg ttgtcttctg ctgcttgagt 6240 

acagatccaa ttgcagcata tacttggcaa gcagctcgta caccgccttg acagtttgcc 6300 

ggcaacttgt caatgccctt cttagctctc accatgatag cgtctgcctt tcctacaagc 63 60 

ttcagagaca agcccaacag tctttgatca cctaggctac gggcgttgcc ttgctgtatt 6420 

tgttctgttt cttcttttct aagccattgt tgaggcagat aacatcgacc caacatcctc 6480 

gagccatact acagcataaa aggatacgtt ttctttaaca gaaatttacc cttttgttat 6540 

cagcacatac aaaaaaaaag aaatttaaga tgagtaggac ttccattctc tcaaaaattt 6600 

tattcaatcc ataaatgaat tatttttgga caaaaaagaa agattatgcc tgattttctc 6660 

tatttttttt ttttttacaa ctccaccaat actttctagc ccagcttggc gtaatcatgg 6720 

tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc 6780 

ggaagcataa agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg 6840 

ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc 6900 

ggccaacgcg cggggagagg cggtttgcgt attgggccaa agacaaaagg gcgacattca 6960 

accgattgag ggagggaagg taaatattga cggaaattat tcattaaagg tgaattatca 7020 
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ccgtcaccga cttgagccat ttgggaatta gagccagcaa aatcaccagt agcaccatta 7080 

ccattagcaa ggccggaaac gtcaccaatg aaaccatcga tagcagcacc gtaatcagta 7140 

gcgacagaat caagtttgcc tttagcgtca gactgtagcg cgttttcatc ggcattttcg 7200 

gtcatagccc ccttattagc gtttgccatc ttttcataat caaaatcacc ggaaccagag 7260 

ccaccaccgg aaccgcctcc ctcagagccg ccaccctcag aaccgccacc ctcagagcca 7320 

ccaccctcag agccgccacc agaaccacca ccagagccgc cgccagcatt gacaggaggc 7380 

ccgatctagt aacatagatg acaccgcgcg cgataattta tcctagtttg cgcgctatat 7440 

tttgttttct atcgcgtatt aaatgtataa ttgcgggact ctaatcataa aaacccatct 7500 

cataaataac gtcatgcatt acatgttaat tattacatgc ttaacgtaat tcaacagaaa 7560 

ttatatgata atcatcgcaa gaccggcaac aggattcaat cttaagaaac tttattgcca 7620 

aatgtttgaa cgatcgggga tcatccgggt ctgtggcggg aactccacga aaatatccga 7680 

acgcagcaag atatcgcggt gcatctcggt cttgcctggg cagtcgccgc cgacgccgtt 7740 

gatgtggacg ccgggcccga tcatattgtc gctcaggatc gtggcgttgt gcttgtcggc 7800 

cgttgctgtc gtaatgatat cggcaccttc gaccgcctgt tccgcagaga tcccgtgggc 7860 

gaagaactcc agcatgagat ccccgcgctg gaggatcatc cagccggcgt cccggaaaac 7920 

gattccgaag cccaaccttt catagaaggc ggcggtggaa tcgaaatctc gtgatggcag 7980 

gttgggcgtc gcttggtcgg tcatttcgaa ccccagagtc ccgctcagaa gaactcgtca 8040 

agaaggcgat agaaggcgat gcgctgcgaa tcgggagcgg cgataccgta aagcacgagg 8100 

aagcggtcag cccattcgcc gccaagctct tcagcaatat cacgggtagc caacgctatg 8160 

tcctgatagc ggtccgccac acccagccgg ccacagtcga tgaatccaga aaagcggcca 8220 

ttttccacca tgatattcgg caagcaggca tcgccatggg tcacgacgag atcatcgccg 8280 
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tcgggcatgc gcgccttgag cctggcgaac agttcggctg gcgcgagccc ctgatgctct 8340 

tcgtccagat catcctgatc gacaagaccg gcttccatcc gagtacgtgc tcgctcgatg 8400 

cgatgtttcg cttggtggtc gaatgggcag gtagccggat caagcgtatg cagccgccgc 8460 

attgcatcag ccatgatgga tactttctcg gcaggagcaa ggtgagatga caggagatcc 8520 

tgccccggca cttcgcccaa tagcagccag tcccttcccg cttcagtgac aacgtcgagc 8580 

acagctgcgc aaggaacgcc cgtcgtggcc agccacgata gccgcgctgc ctcgtcctgc 8640 

agttcattca gggcaccgga caggtcggtc ttgacaaaaa gaaccgggcg cccctgcgct 8700 

gacagccgga acacggcggc atcagagcag ccgattgtct gttgtgccca gtcatagccg 8760 

aatagcctct ccacccaagc ggccggagaa cctgcgtgca atccatcttg ttcaatcatg 8820 

cgaaacgatc cagatccggt gcagattatt tggattgaga gtgaatatga gactctaatt 8880 
ggataccgag gggaatttat ggaacgtcag tggagcattt ttgacaagaa atatttgcta 8940 
gctgatagtg accttaggcg acttttgaac gcgcaataat ggtttctgac gtatgtgctt 9000 
agctcattaa actccagaaa cccgcggctg agtggctcct tcaacgttgc ggttctgtca 9060 
gttccaaacg taaaacggct tgtcccgcgt catcggcggg ggtcataacg tgactccctt 9120 
aattctccgc tcatgatcag attgtcgttt cccgccttca gtttaaacta tcagtgtttg 9180 
acaggatata ttggcgggta aacctaagag aaaagagcgt ttattagaat aatcggatat 9240 
ttaaaagggc gtgaaaaggt ttatccgttc gtccatttgt atgtgcatgc caaccacagg 9300 
gttccccaga tctggcgccg gccagcgaga cgagcaagat tggccgccgc ccgaaacgat 9360 
ccgacagcgc gcccagcaca ggtgcgcagg caaattgcac caacgcatac agcgccagca 9420 
gaatgccata gtgggcggtg acgtcgttcg agtgaaccag atcgcgcagg aggcccggca 9480 
gcaccggcat aatcaggccg atgccgacag cgtcgagcgc gacagtgctc agaattacga 9540 
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tcaggggtat gttgggtttc acgtctggcc tccggaccag cctccgctgg tccgattgaa 9600 

cgcgcggatt ctttatcact gataagttgg tggacatatt atgtttatca gtgataaagt 9660 

gtcaagcatg acaaagttgc agccgaatac agtgatccgt gccgccctgg acctgttgaa 9720 

cgaggtcggc gtagacggtc tgacgacacg caaactggcg gaacggttgg gggttcagca 9780 

gccggcgctt tactggcact tcaggaacaa gcgggcgctg ctcgacgcac tggccgaagc 9840 

catgctggcg gagaatcata cgcattcggt gccgagagcc gacgacgact ggcgctcatt 9900 

tctgatcggg aatgcccgca gcttcaggca ggcgctgctc gcctaccgcg atggcgcgcg 9960 

catccatgcc ggcacgcgac cgggcgcacc gcagatggaa acggccgacg cgcagcttcg 10020 

cttcctctgc gaggcgggtt tttcggccgg ggacgccgtc aatgcgctga tgacaatcag 10080 

ctacttcact gttggggccg tgcttgagga gcaggccggc gacagcgatg ccggcgagcg 10140 

cggcggcacc gttgaacagg ctccgctctc gccgctgttg cgggccgcga tagacgcctt 10200 

cgacgaagcc ggtccggacg cagcgttcga gcagggactc gcggtgattg tcgatggatt 10260 

ggcgaaaagg aggctcgttg tcaggaacgt tgaaggaccg agaaagggtg acgattgatc 10320 

aggaccgctg ccggagcgca acccactcac tacagcagag ccatgtagac aacatcccct 103 80 

ccccctttcc accgcgtcag acgcccgtag cagcccgcta cgggcttttt catgccctgc 10440 

cctagcgtcc aagcctcacg gccgcgctcg gcctctctgg cggccttctg gcgctcttcc 10500 

gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 10560 

cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 10620 

tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 10680 

cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 10740 

aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 10800 
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cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 10860 

gcgcttttcc gctgcataac cctgcttcgg ggtcattata gcgatttttt cggtatatcc 10920 

atcctttttc gcacgatata caggattttg ccaaagggtt cgtgtagacfe ttccttggtg 10980 

tatccaacgg cgtcagccgg gcaggatagg tgaagtaggc ccacccgcga gcgggtgttc 11040 

cttcttcact gtcccttatt cgcacctggc ggtgctcaac gggaatcctg ctctgcgagg 11100 

ctggccggct accgccggcg taacagatga gggcaagcgg atggctgatg aaaccaagcc 11160 

aaccaggaag ggcagcccac ctatcaaggt gtactgcctt ccagacgaac gaagagcgat 11220 

tgaggaaaag gcggcggcgg ccggcatgag cctgtcggcc tacctgctgg ccgtcggcca 11280 

gggctacaaa atcacgggcg tcgtggacta tgagcacgtc cgcgagctgg cccgcatcaa 11340 

tggcgacctg ggccgcctgg gcggcctgct gaaactctgg ctcaccgacg acccgcgcac 11400 

ggcgcggttc ggtgatgcca cgatcctcgc cctgctggcg aagatcgaag agaagcagga 11460 

cgagcttggc aaggtcatga tgggcgtggt ccgcccgagg gcagagccat gactttttta 11520 

gccgctaaaa cggccggggg gtgcgcgtga ttgccaagca cgtccccatg cgctccatca 11580 

agaagagcga cttcgcggag ctggtgaagt acatcaccga cgagcaaggc aagaccgagc 11640 

gcctttgcga cgctcaccgg gctggttgcc ctcgccgctg ggctggcggc cgtctatggc 11700 

cctgcaaacg cgccagaaac gccgtcgaag ccgtgtgcga gacaccgcgg ccgccggcgt 11760 

tgtggatacc tcgcggaaaa cttggccctc actgacagat gaggggcgga cgttgacact 11820 

tgaggggccg actcacccgg cgcggcgttg acagatgagg ggcaggctcg atttcggccg 11880 

gcgacgtgga gctggccagc ctcgcaaatc ggcgaaaacg cctgatttta cgcgagtttc 11940 

ccacagatga tgtggacaag cctggggata agtgccctgc ggtattgaca cttgaggggc 12000 

gcgactactg acagatgagg ggcgcgatcc ttgacacttg aggggcagag tgctgacaga 12060 
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tgaggggcgc acctattgac atttgagggg ctgtccacag gcagaaaatc cagcatttgc 12120 

aagggtttcc gcccgttttt cggccaccgc taacctgtct tttaacctgc ttttaaacca 12180 

atatttataa accttgtttt taaccagggc tgcgccctgt gcgcgtgacc gcgcacgccg 12240 

aaggggggtg cccccccttc tcgaaccctc ccggcccgct aacgcgggcc tcccatcccc 12300 

ccaggggctg cgcccctcgg ccgcgaacgg cctcacccca aaaatggcag cgctggcagt 12360 

ccttgccatt gccgggatcg gggcagtaac gggatgggcg atcagcccga gcgcgacgcc 12420 

cggaagcatt gacgtgccgc aggtgctggc atcgacattc agcgaccagg tgccgggcag 12480 

tgagggcggc ggcctgggtg gcggcctgcc cttcacttcg gccgtcgggg cattcacgga 12540 

cttcatggcg gggccggcaa tttttacctt gggcattctt ggcatagtgg tcgcgggtgc 12600 

cgtgctcgtg ttcgggggtg cgataaaccc agcgaaccat ttgaggtgat aggtaagatt 12660 

ataccgaggt atgaaaacga gaattggacc tttacagaat tactctatga agcgccatat 12720 

ttaaaaagct accaagacga agaggatgaa gaggatgagg aggcagattg ccttgaatat 12780 

attgacaata ctgataagat aatatatctt ttatatagaa gatatcgccg tatgtaagga 12840 

tttcaggggg caaggcatag gcagcgcgct tatcaatata tctatagaat gggcaaagca 12900 

taaaaacttg catggactaa tgcttgaaac ccaggacaat aaccttatag cttgtaaatt 12960 

ctatcataat tgggtaatga ctccaactta ttgatagtgt tttatgttca gataatgccc 13020 

gatgactttg tcatgcagct ccaccgattt tgagaacgac agcgacttcc gtcccagccg 13080 

tgccaggtgc tgcctcagat tcaggttatg ccgctcaatt cgctgcgtat atcgcttgct 13140 

gattacgtgc agctttccct tcaggcggga ttcatacagc ggccagccat ccgtcateca 13200 

tatcaccacg tcaaagggtg acagcaggct cataagacgc cccagcgtcg ccatagtgcg 13260 

ttcaccgaat acgtgcgcaa caaccgtctt ccggagactg tcatacgcgt aaaacagcca 13320 
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gcgctggcgc gatttagccc cgacatagcc ccactgttcg tccatttccg cgcagacgat 13380 

gacgtcactg cccggctgta tgcgcgaggt taccgactgc ggcctgagtt ttttaagtga 13440 

cgtaaaatcg tgttgaggcc aacgcccata atgcgggctg ttgcccggca tccaacgcca 13500 

ttcatggcca tatcaatgat tttctggtgc gtaccgggtt gagaagcggt gtaagtgaac 13560 

tgcagttgcc atgttttacg gcagtgagag cagagatagc gctgatgtcc ggcggtgctt 13620 

ttgccgttac gcaccacccc gtcagtagct gaacaggagg gacagctgat agacacagaa 13 680 

gccactggag cacctcaaaa acaccatcat acactaaatc agtaagttgg cagcatcacc 13740 

cataattgtg gtttcaaaat cggctccgtc gatactatgt tatacgccaa ctttgaaaac 13 800 

aactttgaaa aagctgtttt ctggtattta aggttttaga atgcaaggaa cagtgaattg 13860 

gagttcgtct tgttataatt agcttcttgg ggtatcttta aatactgtag aaaagaggaa 13920 

ggaaataata aatggctaaa atgagaatat caccggaatt gaaaaaactg atcgaaaaat 13980 

accgctgcgt aaaagatacg gaaggaatgt ctcctgctaa ggtatataag ctggtgggag 14040 

aaaatgaaaa cctatattta aaaatgacgg acagccggta taaagggacc acctatgatg 14100 

tggaacggga aaaggacatg atgctatggc tggaaggaaa gctgcctgtt ccaaaggtcc 14160 

tgcactttga acggcatgat ggctggagca atctgctcat gagtgaggcc gatggcgtcc 14220 

tttgctcgga agagtatgaa gatgaacaaa gccctgaaaa gattatcgag ctgtatgcgg 14280 

agtgcatcag gctctttcac tccatcgaca tatcggattg tccctatacg aatagcttag 14340 

acagccgctt agccgaattg gattacttac tgaataacga tctggccgat gtggattgcg 14400 

aaaactggga agaagacact ccatttaaag atccgcgcga gctgtatgat tttttaaaga 14460 

cggaaaagcc cgaagaggaa cttgtctttt cccacggcga cctgggagac agcaacatct 14520 



WO 2004/063358 PCT/EP2004/000100 

151/358 

ttgtgaaaga tggcaaagta agtggcttta ttgatcttgg gagaagcggc agggcggaca 14580 

agtggtatga cattgccttc tgcgtccggt cgatcaggga ggatatcggg gaagaacagt 14640 

atgtcgagct attttttgac ttactgggga tcaagcctga ttgggagaaa ataaaatatt 14700 

atattttact ggatgaattg ttttagtacc tagatgtggc gcaacgatgc cggcgacaag 14760 

caggagcgca ccgacttctt ccgcatcaag tgttttggct ctcaggccga ggcccacggc 14820 

aagtatttgg gcaaggggtc gctggtattc gtgcagggca agattcggaa taccaagtac 14880 

gagaaggacg gccagacggt ctacgggacc gacttcattg ccgataaggt ggattatctg 14940 

gacaccaagg caccaggcgg gtcaaatcag gaataagggc acattgcccc ggcgtgagtc 15000 

ggggcaatcc cgcaaggagg gtgaatgaat cggacgtttg accggaaggc atacaggcaa 15060 

gaactgatcg acgcggggtt ttccgccgag gatgccgaaa ccatcgcaag ccgcaccgtc 15120 

atgcgtgcgc cccgcgaaac cttccagtcc gtcggctcga tggtccagca agctacggcc 15180 

aagatcgagc gcgacagcgt gcaactggct ccccctgccc tgcccgcgcc atcggccgcc 15240 

gtggagcgtt cgcgtcgtct cgaacaggag gcggcaggtt tggcgaagtc gatgaccatc 15300 

gacacgcgag gaactatgac gaccaagaag cgaaaaaccg ccggcgagga cctggcaaaa 15360 

caggtcagcg aggccaagca ggccgcgttg ctgaaacaca cgaagcagca gatcaaggaa 15420 

atgcagcttt ccttgttcga tattgcgccg tggccggaca cgatgcgagc gatgccaaac 15480 

gacacggccc gctctgccct gttcaccacg cgcaacaaga aaatcccgcg cgaggcgctg 15540 

caaaacaagg tcattttcca cgtcaacaag gacgtgaaga tcacctacac cggcgtcgag 15600 

ctgcgggccg acgatgacga actggtgtgg cagcaggtgt tggagtacgc gaagcgcacc 15660 

cctatcggcg agccgatcac cttcacgttc tacgagcttt gccaggacct gggctggtcg 15720 

atcaatggcc ggtattacac gaaggccgag gaatgcctgt cgcgcctaca ggcgacggcg 15780 
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atgggcttca cgtccgaccg cgttgggcac ctggaatcgg tgtcgctgct gcaccgcttc 15840 

cgcgtcctgg accgtggcaa gaaaacgtcc cgttgccagg tcctgatcga cgaggaaatc 15900 

gtcgtgctgt ttgctggcga ccactacacg aaattcatat gggagaagta ccgcaagctg 15960 

tcgccgacgg cccgacggat gttcgactat ttcagctcgc accgggagcc gtacccgctc 16020 

aagctggaaa ccttccgcct catgtgcgga tcggattcca cccgcgtgaa gaagtggcgc 16080 

gagcaggtcg gcgaagcctg cgaagagttg cgaggcagcg gcctggtgga acacgcctgg 16140 

gtcaatgatg acctggtgca ttgcaaacgc tagggccttg tggggtcagt tccggctggg 16200 

ggttcagcag ccagcgcttt actggcattt caggaacaag cgggcactgc tcgacgcact 16260 

tgcttcgctc agtatcgctc gggacgcacg gcgcgctcta cgaactgccg ataaacagag 16320 

gattaaaatt gacaattgtg attaaggctc agattcgacg gcttggagcg gccgacgtgc 16380 

aggatttccg cgagatccga ttgtcggccc tgaagaaagc tccagagatg ttcgggtccg 16440 

tttacgagca cgaggagaaa aagcccatgg aggcgttcgc tgaacggttg cgagatgccg 16500 

tggcattcgg cgcctacatc gacggcgaga tcattgggct gtcggtctfcc aaacaggagg 16560 

acggccccaa ggacgctcac aaggcgcatc tgtccggcgt tttcgtggag cccgaacagc 16620 

gaggccgagg ggtcgccggt atgctgctgc gggcgttgcc ggcgggttta ttgctcgtga 16680 

tgatcgtccg acagattcca acgggaatct ggtggatgcg catcttcahc ctcggcgcac 16740 

ttaatatttc gctattctgg agcttgttgt ttatttcggt ctaccgcctg ccgggcgggg 16800 

tcgcggcgac ggtaggcgct gtgcagccgc tgatggtcgt gttcatctct gccgctctgc 16860 

taggtagccc gatacgattg atggcggtcc tgggggctat ttgcggaact gcgggcgtgg 16920 

cgctgttggt gttgacacca aacgcagcgc tagatcctgt cggcgtcgca gcgggcctgg 16980 

cgggggcggt ttccatggcg ttcggaaccg tgctgacccg caagtggcaa cctcccgtgc 17040 
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ctctgctcac ctttaccgcc tggcaactgg cggccggagg acttctgctc gttccagtag 17100 

ctttagtgtt tgatccgcca atcccgatgc ctacaggaac caatgttctc ggcctggcgt 17160 

ggctcggcct gatcggagcg ggtttaacct acttcctttg gttccggggg atctcgcgac 17220 

tcgaacctac agttgtttcc ttactgggct ttctcagccc cagatctggg gtcgatcagc 17280 

cggggatgca tcaggccgac agtcggaact tcgggtcccc gacctgtacc attcggtgag 17340 

caatggatag gggagttgat atcgtcaacg ttcacttcta aagaaatagc gccactcagc 17400 

ttcctcagcg gctttatcca gcgatttcct attatgtcgg catagttctc aagatcgaca 17460 

gcctgtcacg gttaagcgag aaatgaataa gaaggctgat aattcggatc tctgcgaggg 17520 

agatgatatt tgatcacagg cagcaacgct ctgtcatcgt tacaatcaac atgctaccct 17580 

ccgcgagatc atccgtgttt caaacccggc agcttagttg ccgttcttcc gaatagcatc 17640 

ggtaacatga gcaaagtctg ccgccttaca acggctctcc cgctgacgcc gtcccggact 17700 

gatgggctgc ctgtatcgag tggtgatttt gtgccgagct gccggtcggg gagctgttgg 17760 

ctggctggtg gcaggatata ttgtggtgta aacaaattga cgcttagaca acttaataac 17820 

acattgcgga cgtttttaat gtactggggt ggtttttctt ttcaccagtg agacgggcaa 17880 

cagctgattg cccttcaccg cctggccctg agagagttgc agcaagcggt ccacgctggt 17940 

ttgccccagc aggcgaaaat cctgtttgat ggtggttccg aaatcggcaa aatcccttat 18000 

aaatcaaaag aatagcccga gatagggttg agtgttgttc cagtttggaa caagagtcca 18060 

ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc 18120 

ccactacgtg aaccatcacc caaatcaagt tttttggggt cgaggtgccg taaagcacta 18180 

aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg 18240 

gcgagaaagg aagggaagaa agcgaaagga gcgggcgcca ttcaggctgc gcaactgttg 18300 
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ggaagggcga tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc 18360 
tgcaaggcga ttaagttggg taacgccagg gttttcccag tcacgacgtt gtaaaacgac 18420 
ggccagtgaa ttcgagctcg gtacccggg 18449 

<210> 41 

<211> 18449 

<212> DNA 

<213> Artificial 

<220> 

<223> Plasmid 



<220> 

<221> misc_feature 

<222> (3471) . . (3471) 

<223> n is a, c, g, or t 

<220> 

<221> misc_f eature 

<222> (3679) . . (3679) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (3770) . . (3770) 

<223> n is a, c, g, or t 

<400> 41 

gatctttcga cactgaaata cgtcgagcct gctccgcttg gaagcggcga ggagcctcgt 60 

cctgtcacaa ctaccaacat ggagtacgat aagggccagt tccgccagct cattaagagc 120 

cagttcatgg gcgttggcat gatggccgtc atgcatctgt acttcaagta caccaacgct 180 

cttctgatcc agtcgatcat ccgctgaagg cgctttcgaa tctggttaag atccacgtct 240 



tcgggaagcc agcgactggt gacctccagc gtccctttaa ggctgccaac agctttctca 300 
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gccagggcca gcccaagacc gacaaggcct ccctccagaa cgccgagaag aactggaggg 360 
gtggtgtcaa ggaggagtaa gctccttatt gaagtcggag gacggagcgg tgtcaagagg 420 
atattcttcg actctgtatt atagataaga tgatgaggaa ttggaggtag catagcttca 480 
tttggatttg ctttccaggc tgagactcta gcttggagca tagagggtcc tttggctttc 540 
aatattctca agtatctcga gtttgaactt attccctgtg aaccttttat tcaccaatga 600 
gcattggaat gaacatgaat ctgaggactg caatcgccat gaggttttcg aaatacatcc 660 
ggatgtcgaa ggcttggggc acctgcgttg gttgaattta gaacgtggca ctattgatca 720 
tccgatagct ctgcaaaggg cgttgcacaa tgcaagtcaa acgttgctag cagttccagg 780 
tggaatgtta tgatgagcat tgtattaaat caggagatat agcatgatct ctagttagct 840 
caccacaaaa gtcagacggc gtaaccaaaa gtcacacaac acaagctgta aggatttcgg 900 
cacggctacg gaagacggag aagccacctt cagtggactc gagtaccatt taattctatt 960 

tgtgtttgat cgagacctaa tacagcccct acaacgacca tcaaagtcgt atagctacca 1020 

gtgaggaagt ggactcaaat cgacttcagc aacatctcct ggataaactt taagcctaaa 1080 

ctatacagaa taagataggt ggagagctta taccgagctc ccaaatctgt ccagatcatg 1140 

gttgaccggt gcctggatct tcctatagaa tcatccttat tcgttgacct agctgattct 1200 

ggagtgaccc agagggtcat gacttgagcc taaaatccgc cgcctccacc atttgtagaa 1260 

aaatgtgacg aactcgtgag ctctgtacag tgaccggtga ctctttctgg catgcggaga 1320 

gacggacgga cgcagagaga agggctgagt aataagccac tggccagaca gctctggcgg 1380 

ctctgaggtg cagtggatga ttattaatcc gggaccggcc gcccctccgc cccgaagtgg 1440 

aaaggctggt gtgcccctcg ttgaccaaga atctattgca tcatcggaga atatggagct 1500 

tcatcgaatc accggcagta agcgaaggag aatgtgaagc caggggtgta tagccgtcgg 1560 
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cgaaatagca tgccattaac ctaggtacag aagtccaatt gcttccgatc tggtaaaaga 1620 

ttcacgagat agtaccttct ccgaagtagg tagagcgagt acccggcgcg taagctccct 1680 

aattggccca tccggcatct gtagggcgtc caaatatcgt gcctctcctg ctttgcccgg 1740 

tgtatgaaac cggaaaggcc gctcaggagc tggccagcgg cgcagaccgg gaacacaagc 1800 

tggcagtcga cccatccggt gctctgcact cgacctgctg aggtccctca gtccctggta 1860 

ggcagctttg ccccgtctgt ccgcccggtg tgtcggcggg gttgacaagg tcgttgcgtc 1920 

agtccaacat ttgttgccat attttcctgc tctccccacc agctgctctt ttcttttctc 1980 

tttcttttcc catcttcagt atattcatct tcccatccaa gaacctttat ttcccctaag 2040 

taagtacttt gctacatcca tactccatcc ttcccatccc ttattccttt gaacctttca 2100 

gttcgagctt tcccacttca tcgcagcttg actaacagct accccgcttg agcagacatc 2160 

accatgcctg aactcaccgc gacgtctgtc gagaagtttc tgatcgaaaa gttcgacagc 2220 

gtctccgacc tgatgcagct ctcggagggc gaagaatctc gtgctttcag cttcgatgta 2280 

ggagggcgtg gatatgtcct gcgggtaaat agctgcgccg atggtttcta caaagatcgt 2340 

tatgtttatc ggcactttgc atcggccgcg ctcccgattc cggaagtgct tgacattggg 2400 

gaattcagcg agagcctgac ctattgcatc tcccgccgtg cacagggtgt cacgttgcaa 2460 

gacctgcctg aaaccgaact gcccgctgtt ctgcagccgg tcgcggaggc catggatgcg 2520 

atcgctgcgg ccgatcttag ccagacgagc gggttcggcc cattcggacc gcaaggaatc 2580 

ggtcaataca ctacatggcg tgatttcata tgcgcgattg ctgatcccca tgtgtatcac 2640 

tggcaaactg tgatggacga caccgtcagt gcgtccgtcg cgcaggctct cgatgagctg 2700 

atgctttggg ccgaggactg ccccgaagtc cggcacctcg tgcacgcgga tttcggctcc 2760 

aacaatgtcc tgacggacaa tggccgcata acagcggtca ttgactggag cgaggcgatg 2820 
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ttcggggatt cccaatacga ggtcgccaac atcttcttct ggaggccgtg gttggcttgt 2880 

atggagcagc agacgcgcta cttcgagcgg aggcatccgg agcttgcagg atcgccgcgg 2940 

ctccgggcgt atatgctccg cattggtctt gaccaactct atcagagctt ggttgacggc 3000 

aatttcgatg atgcagcttg ggcgcagggt cgatgcgacg caatcgtccg atccggagcc 3060 

gggactgtcg ggcgtacaca aatcgcccgc agaagcgcgg ccgtctggac cgatggctgt 3120 

gtagaagtac tcgccgatag tggaaaccga cgccccagca ctcgtccgag ggcaaaggaa 3180 

tagagtagat gccgaccgcg ggatcgatcc acttaacgtt actgaaatca tcaaacagct 3240 

tgacgaatct ggatataaga tcgttggtgt cgatgtcagc tccggagttg agacaaatgg 3300 

tgttcaggat ctcgataaga tacgttcatt tgtccaagca gcaaagagtg ccttctagtg 3360 

atttaatagc tccatgtcaa caagaataaa acgcgttttc gggtttacct cttccagata 3420 

cagctcatct gcaatgcatt aatgcattga ctgcaaccta gtaacgcctt ncaggctccg 3480 

gcgaagagaa gaatagctta gcagagctat tttcattttc gggagacgag atcaagcaga 3540 

tcaacggtcg tcaagagacc tacgagactg aggaatccgc tcttggetcc acgcgactat 3600 

atatttgtct ctaattgtac tttgacatgc tcctcttctt tactctgata gcttgactat 3 660 

gaaaattccg tcaccagcnc ctgggttcgc aaagataatt gcatgtttct tccttgaact 3720 

ctcaagccta caggacacac attcatcgta ggtataaacc tcgaaatcan ttcctactaa 3780 

gatggtatac aatagtaacc atgcatggtt gcctagtgaa tgctccgtaa cacccaatac 3 840 

gccggccgaa actttfcttac aactctccta tgagtcgttt acccagaatg cacaggtaca 3900 

cttgtttaga ggtaatcctt ctttctagct agaagtcctc gtgtactgtg taagcgccca 3960 

ctccacatct ccactcgacc tgcaggcatg caaagcttga gattaaaata gataaggaaa 4020 
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agaaagtgaa aagaaattcg gaagcatggc acattcttct ttttataaat acatgcctga 4080 

ctttcttttt ccatcgatat gatatatgca tatgatagat atacaagcaa tcttcttcaa 4140 

ggagtttgaa attttgtcct ccaggagcaa aaaaaagttt ttttttatac atgtttgtac 4200 

acaagaatag ttaccaattt gctttggtct tacgtgctgc aagtttatat cgttttcaat 4260 

ttctttgtct ttacattttc tttgtccttt atctttcctc atttagtctt tgggagaatt 4320 

aggaaaaggg agcggaaagg taagaaatgc ttgcgtattt tactaattcg gcaaacatcc 4380 

aatttggcaa acagcagcct gtgcaacgct ctcgagatga cagtatcttt gattacactc 4440 

taaatctcga tgacccgacc aaaaagagcg aacaaagaaa taatcttgtg cattcgaata 4500 

tgatggaaga ttttttcccc cttattctaa atgttgacat agcgtgtatg ttatataaac 4560 

aaaaagaaat tgtacaaact ttcttttctt ctctttttat tttatctcta tgctgtcgaa 4620 

gctgcagtca atcagcgtca aggcccgccg cgttgaacta gcccgcgaca tcacgcggcc 4680 

caaagtctgc ctgcatgctc agcggtgctc gttagttcgg ctgcgagtgg cagcaccaca 4740 

gacagaggag gcgctgggaa ccgtgcaggc tgccggcgcg ggcgatgagc acagcgccga 4800 

tgtagcactc cagcagcttg accgggctat cgcagagcgt cgtgcccggc gcaaacggga 4860 

gcagctgtca taccaggctg ccgccattgc agcatcaatt ggcgtgtcag gcattgccat 4920 

cttcgccacc tacctgagat ttgccatgca catgaccgtg ggcggcgcag tgccatgggg 4980 

tgaagtggct ggcactctcc tcttggtggt tggtggcgcg ctcggcatgg agatgtatgc 5040 

ccgctatgca cacaaagcca tctggcatga gtcgcctctg ggctggctgc tgcacaagag 5100 

ccaccacaca cctcgcactg gaccctttga agccaacgac ttgtttgcaa tcatcaatgg 5160 

actgcccgcc atgctcctgt gtacctttgg cttctggctg cccaacgtcc tgggggcggc 5220 

ctgctttgga gcggggctgg gcatcacgct atacggcatg gcatatatgt ttgtacacga 5280 
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tggcctggtg cacaggcgct ttcccaccgg gcccatcgct ggcctgccct acatgaagcg 5340 

cctgacagtg gcccaccagc tacaccacag cggcaagtac ggtggcgcgc cctggggtat 5400 

gttcttgggt ccacaggagc tgcagcacat tccaggtgcg gcggaggagg tggagcgact 5460 

ggtcctggaa ctggactggt ccaagcgggc gattgtgact gatagcgaga ctctgggtcg 5520 

atgttatctg cctcaacaat ggcttagaaa agaagaaaca gaacaaatac agcaaggcaa 5580 

cgcccgtagc ctaggtgatc aaagactgtt gggcttgtct ctgaagcttg taggaaaggc 5640 

agacgctatc atggtgagag ctaagaaggg cattgacaag ttgccggcaa actgtcaagg 5700 

cggtgtacga gctgcttgcc aagtatatgc tgcaattgga tctgtactca agcagcagaa 5760 

gacaacatat cctacaagag ctcatctaaa aggaagcgaa cgtgccaaga ttgctctgtt. 5820 

gagtgtatac aacctctatc aatctgaaga caagcctgtg gctctccgtc aagctagaaa 5880 

gattaagagt ttttttgttg attagtgaat ttttgtttta tttatgtctg atagttcaat 5940 

aaagagacaa cacatacaat ataaaatcat tgtctttaaa tgttaattta gtagagtgta 6000 

aagcctgcat tttttttgta cgcataaaca atgaattcac cccgcttctg gtttttaaat 6060 

aattatgtca aactagggaa aattcttttt tttctcttcg ttcttttttt ggcttgttgt 6120 

ggagtcacag gcttgtcttc agattgatag aggttgtata cactcaacag agcaatcttg 6180 

gcacgttcgc ttccttttag atgagctctt gtaggatatg ttgtcttctg ctgcttgagt 6240 

acagatccaa ttgcagcata tacttggcaa gcagctcgta caccgccttg acagtttgcc 6300 

ggcaacttgt caatgccctt cttagctctc accatgatag cgtctgcctt tcctacaagc 63 60 

ttcagagaca agcccaacag tctttgatca cctaggctac gggcgttgcc ttgctgtatt 6420 

tgttctgttfc cttcttttct aagccattgt tgaggcagat aacatcgacc caacatcctc 6480 

gagccatact acagcataaa aggatacgtt ttctttaaca gaaatttacc cttttgttat 6540 



WO 2004/063358 PCT/EP2004/000100 

160/358 

cagcacatac aaaaaaaaag aaatttaaga tgagtaggac ttccattctc tcaaaaattt 6600 

tattcaatcc ataaatgaat tatttttgga caaaaaagaa agattatgcc tgattttctc 6660 

tatttttttt ttttttacaa ctccaccaat actttctagc ccagcttggc gtaatcatgg 6720 

tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc 6780 

ggaagcataa agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg 6840 

ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc 6900 

ggccaacgcg cggggagagg cggtttgcgt attgggccaa agacaaaagg gcgacattca 6960 

accgattgag ggagggaagg taaatattga cggaaattat tcattaaagg tgaattatca 7020 

ccgtcaccga cttgagccat ttgggaatta gagccagcaa aatcaccagt agcaccatta 7080 

ccattagcaa ggccggaaac gtcaccaatg aaaccatcga tagcagcacc gtaatcagta 7140 

gcgacagaat caagtttgcc tttagcgtca gactgtagcg cgttttcatc ggcattttcg 72 00 

gtcatagccc ccttattagc gtttgccatc ttttcataat caaaatcacc ggaaccagag 7260 

ccaccaccgg aaccgcctcc ctcagagccg ccaccctcag aaccgccacc ctcagagcca 7320 

ccaccctcag agccgccacc agaaccacca ccagagccgc cgccagcatt gacaggaggc 7380 

ccgatctagt aacatagatg acaccgcgcg cgataattta tcctagtttg cgcgctatat 7440 

tttgttttct atcgcgtatt aaatgtataa ttgcgggact ctaatcataa aaacccatct 7500 

cataaataac gtcatgcatt acatgttaat tattacatgc ttaacgtaat tcaacagaaa 7560 

ttatatgata atcatcgcaa gaccggcaac aggattcaat cttaagaaac tttattgcca 7620 

aatgtttgaa cgatcgggga tcatccgggt ctgtggcggg aactccacga aaatatccga 7680 

acgcagcaag atatcgcggt gcatctcggt cttgcctggg cagtcgccgc cgacgccgtt 7740 

gatgtggacg ccgggcccga tcatattgtc gctcaggatc gtggcgttgt gcttgtcggc 7800 
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cgttgctgtc gtaatgatat cggcaccttc gaccgcctgt tccgcagaga tcccgtgggc 7860 

gaagaactcc agcatgagat ccccgcgctg gaggatcatc cagccggcgt cccggaaaac 7920 

gattccgaag cccaaccttt catagaaggc ggcggtggaa tcgaaatctc gtgatggcag 7980 

gttgggcgtc gcttggtcgg tcatttcgaa ccccagagtc ccgctcagaa gaactcgtca 8040 

agaaggcgat agaaggcgat gcgctgcgaa tcgggagcgg cgataccgta aagcacgagg 8100 

aagcggtcag cccattcgcc gccaagctct tcagcaatat cacgggtagc caacgctatg 8160 

tcctgatagc ggtccgccac acccagccgg ccacagtcga tgaatccaga aaagcggcca 8220 

ttttccacca tgatattcgg caagcaggca tcgccatggg tcacgacgag atcatcgccg 8280 

tcgggcatgc gcgccttgag cctggcgaac agttcggctg gcgcgagccc ctgatgctct 8340 

tcgtccagat catcctgatc gacaagaccg gcttccatcc gagtacgtgc tcgctcgatg 8400 

cgatgtttcg cttggtggtc gaatgggcag gtagccggat caagcgtatg cagccgccgc 8460 

attgcatcag ccatgatgga tactttctcg gcaggagcaa ggtgagatga caggagatcc 8520 

tgccccggca cttcgcccaa tagcagccag tcccttcccg cttcagtgac aacgtcgagc 8580 

acagctgcgc aaggaacgcc cgtcgtggcc agccacgata gccgcgctgc ctcgtcctgc 8640 

i 

agttcattca gggcaccgga caggtcggtc ttgacaaaaa gaaccgggcg cccctgcgct 8700 

gacagccgga acacggcggc atcagagcag ccgattgtct gttgtgccca gtcatagccg 8760 

aatagcctct ccacccaagc ggccggagaa cctgcgtgca atccatcttg ttcaatcatg 8820 

cgaaacgatc cagatccggt gcagattatt tggattgaga gtgaatatga gactctaatt 8880 

ggataccgag gggaatttat ggaacgtcag tggagcattt ttgacaagaa atatttgcta 8940 

gctgatagtg accttaggcg acttttgaac gcgcaataat ggtttctgac gtatgtgctt 9000 

agctcattaa actccagaaa cccgcggctg agtggctcct tcaacgttgc ggttctgtca 9060 
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gttccaaacg taaaacggct tgtcccgcgt catcggcggg ggtcataacg tgactccctt 9120 

aattctccgc tcatgatcag attgtcgttt cccgccttca gtttaaacta tcagtgtttg 9180 

acaggatata ttggcgggta aacctaagag aaaagagcgt ttattagaat aatcggatat 9240 

ttaaaagggc gtgaaaaggt ttatccgttc gtccatttgt atgtgcatgc caaccacagg 9300 

gttccccaga tctggcgccg gccagcgaga cgagcaagat tggccgccgc ccgaaacgat 9360 

ccgacagcgc gcccagcaca ggtgcgcagg caaattgcac caacgcatac agcgccagca 9420 

gaatgccata gtgggcggtg acgtcgttcg agtgaaccag atcgcgcagg aggcccggca 9480 

gcaccggcat aatcaggccg atgccgacag cgtcgagcgc gacagtgctc agaattacga 9540 

tcaggggtat gttgggtttc acgtctggcc tccggaccag cctccgctgg tccgattgaa 9600 

cgcgcggatt ctttatcact gataagttgg tggacatatt atgtttatca gtgataaagt 9660 

gtcaagcatg acaaagttgc agccgaatac agtgatccgt gccgccctgg acctgttgaa 972 0 

cgaggtcggc gtagacggtc tgacgacacg caaactggcg gaacggttgg gggttcagca 9780 
gccggcgctt tactggcact tcaggaacaa gcgggcgctg ctcgacgcac tggccgaagc 9840 
catgctggcg gagaatcata cgcattcggt gccgagagcc gacgacgact ggcgctcatt 9900 
tctgatcggg aatgcccgca gcttcaggca ggcgctgctc gcctaccgcg atggcgcgcg 9960 

catccatgcc ggcacgcgac cgggcgcacc gcagatggaa acggccgacg cgcagcttcg 10020 

cttcctctgc* gaggcgggtt tttcggccgg ggacgccgtc aatgcgctga tgacaatcag 10080* 

ctacttcact gttggggccg tgcttgagga gcaggccggc gacagcgatg ccggcgagcg 10140 

cggcggcacc gttgaacagg ctccgctctc gccgctgttg cgggccgcga tagacgcctt 10200 

cgacgaagcc ggtccggacg cagcgttcga gcagggactc gcggtgattg tcgatggatt 10260 

ggcgaaaagg aggctcgttg tcaggaacgt 'tgaaggaccg agaaagggtg acgattgatc 10320 
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aggaccgctg ccggagcgca acccactcac tacagcagag ccatgtagac aacatcccct 10380 

ccccctttcc accgcgtcag acgcccgtag cagcccgcta cgggcttttt catgccctgc 10440 

cctagcgtcc aagcctcacg gccgcgctcg gcctctctgg cggccttctg gcgctcttcc 10500 

gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 10560 

cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 10620 

tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 10680 

cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 10740 

aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 10800 

cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 10860 

gcgcttttcc gctgcataac cctgcttcgg ggtcattata gcgatttttt cggtatatcc 10920 

atcctttttc gcacgatata caggattttg ccaaagggtt cgtgtagact ttccttggtg 10980 

tatccaacgg cgtcagccgg gcaggatagg tgaagtaggc ccacccgcga gcgggtgttc 11040 

cttcttcact gtcccttatt cgcacctggc ggtgctcaac gggaatcctg ctctgcgagg 11100 

ctggccggct accgccggcg taacagatga gggcaagcgg atggctgatg aaaccaagcc 11160 

aaccaggaag ggcagcccac ctatcaaggt gtactgcctt ccagacgaac gaagagcgat 11220 

tgaggaaaag gcggcggcgg ccggcatgag cctgtcggcc tacctgctgg ccgtcggcca 11280 

gggctacaaa atcacgggcg tcgtggacta tgagcacgtc cgcgagctgg cccgcatcaa 11340 

tggcgacctg ggccgcctgg gcggcctgct gaaactctgg ctcaccgacg acccgcgcac 11400 

ggcgcggttc ggtgatgcca cgatcctcgc cctgctggcg aagatcgaag agaagcagga 11460 

cgagcttggc aaggtcatga tgggcgtggt ccgcccgagg gcagagccat gactttttta 11520 
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gccgctaaaa cggccggggg gtgcgcgtga ttgccaagca cgtccccatg cgctccatca 11580 

agaagagcga cttcgcggag ctggtgaagt acatcaccga cgagcaaggc aagaccgagc 11640 

gcctttgcga cgctcaccgg gctggttgcc ctcgccgctg ggctggcggc cgtctatggc 11700 

cctgcaaacg cgccagaaac gccgtcgaag ccgtgtgcga gacaccgcgg ccgccggcgt 11760 

tgtggatacc tcgcggaaaa cttggccctc actgacagat gaggggcgga cgttgacact 11820 

tgaggggccg actcacccgg cgcggcgttg acagatgagg ggcaggctcg atttcggccg 11880 

gcgacgtgga gctggccagc ctcgcaaatc ggcgaaaacg cctgattbta cgcgagtttc 11940 

ccacagatga tgtggacaag cctggggata agtgccctgc ggtattgaca cttgaggggc 12000 

gcgactactg acagatgagg ggcgcgatcc ttgacacttg aggggcagag tgctgacaga 12060 

tgaggggcgc acctattgac atttgagggg ctgtccacag gcagaaaatc cagcatttgc 12120 

aagggtttcc gcccgttttt cggccaccgc taacctgbct tttaacctgc ttttaaacca 12180 

atatttataa accttgtttt taaccagggc tgcgccctgt gcgcgtgacc gcgcacgccg 12240 

aaggggggtg cccccccttc tcgaaccctc ccggcccgct aacgcgggcc tcccatcccc 12300 

ccaggggctg cgcccctcgg ccgcgaacgg cctcacccca aaaatggcag cgctggcagt 12360 

ccttgccatt gccgggatcg gggcagtaac gggatgggcg atcagcccga gcgcgacgcc 12420 

cggaagcatt gacgtgccgc aggtgctggc atcgacattc agcgaccagg tgccgggcag 12480 

tgagggcggc ggcctgggtg gcggcctgcc cttcacttcg gccgtcgggg cattcacgga 12540 

cttcatggcg gggccggcaa tttttacctt gggcattctt ggcatagtgg tcgcgggtgc 12600 

cgtgctcgtg ttcgggggtg cgataaaccc agcgaaccat ttgaggtgat aggtaagatt 12660 

ataccgaggt atgaaaacga gaattggacc tttacagaat tactctatga agcgccatat 12720 

ttaaaaagct accaagacga agaggatgaa gaggatgagg aggcagattg ccttga&tat 12780 



WO 2004/063358 PCT/EP2004/000100 

165/358 

attgacaata ctgataagat aatatatctt ttatatagaa gatatcgccg tatgtaagga 12840 

tttcaggggg caaggcatag gcagcgcgct tatcaatata tctatagaat gggcaaagca 12900 

taaaaacttg catggactaa tgcttgaaac ccaggacaat aaccttatag cttgtaaatt 12960 

ctatcataat tgggtaatga ctccaactta ttgatagtgt tttatgttca gataatgccc 13020 

gatgactttg tcatgcagct ccaccgattt tgagaacgac agcgacttcc gtcccagccg 13080 

tgccaggtgc tgcctcagat tcaggttatg ccgctcaatt cgctgcgtat atcgcttgct 13140 

gattacgtgc agctttccct tcaggcggga ttcatacagc ggccagccat ccgtcatcca 13200 

tatcaccacg tcaaagggtg acagcaggct cataagacgc cccagcgtcg ccatagtgcg 13260 

ttcaccgaat acgtgcgcaa caaccgtctt ccggagactg tcatacgcgt aaaacagcca 13320 

gcgctggcgc gatttagccc cgacatagcc ccactgttcg tccatttccg cgcagacgat 13380 

gacgtcactg cccggctgta tgcgcgaggt taccgactgc ggcctgagtt ttttaagtga 13440 

cgtaaaatcg tgttgaggcc aacgcccata atgcgggctg ttgcccggca tccaacgcca 13500 

ttcatggcca tatcaatgat tttctggtgc gtaccgggtt gagaagcggt gtaagtgaac 13560 

tgcagttgcc atgttttacg gcagtgagag cagagatagc gctgatgtcc ggcggtgctt 13620 

ttgccgttac gcaccacccc gtcagtagct gaacaggagg gacagctgat agacacagaa 13 680 

gccactggag cacctcaaaa acaccatcat acactaaatc agtaagttgg cagcatcacc 13740 

cataattgtg gtttcaaaat cggctccgtc gatactatgt tatacgccaa ctttgaaaac 13 800 

aactttgptaa aagctgtttt ctggtattta aggttttaga atgcaaggaa cagtgaattg 13860 

gagttcgtct tgttataatt agcttcttgg ggtatcttta aatactgtag aaaagaggaa 13920 

ggaaataata aatggctaaa atgagaatat caccggaatt gaaaaaactg atcgaaaaat 13980 

accgctgcgt aaaagatacg gaaggaatgt ctcctgctaa ggtatataag ctggtgggag 14040 
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aaaatgaaaa cctatattta aaaatgacgg acagccggta taaagggacc acctatgatg 14100 
tggaacggga aaaggacatg atgctatggc tggaaggaaa gctgcctgtt ccaaaggtcc 14160 
tgcactttga acggcatgat ggctggagca atctgctcat gagtgaggcc gatggcgtcc 14220 
tttgctcgga agagtatgaa gatgaacaaa gccctgaaaa gattatcgag ctgtatgcgg 14280 
agtgcatcag gctctttcac tccatcgaca tatcggattg tccctatacg aatagcttag 14340 
acagccgctt agccgaattg gattacttac tgaataacga tctggccgat gtggattgcg 14400 
aaaactggga agaagacact ccatttaaag atccgcgcga gctgtatgat tttttaaaga 14460 
cggaaaagcc cgaagaggaa cttgtctttt cccacggcga cctgggagac agcaacatct 14520 
ttgtgaaaga tggcaaagta agtggcttta ttgatcttgg gagaagcggc agggcggaca 14580 
agtggtatga cattgccttc tgcgtccggt cgatcaggga ggatatcggg gaagaacagt 14640 
atgtcgagct attttttgac ttactgggga tcaagcctga ttgggagaaa ataaaatatt 14700 
atattttact ggatgaattg ttttagtacc tagatgtggc gcaacgatgc cggcgacaag 14760 
caggagcgca ccgacttctt ccgcatcaag tgttttggct ctcaggccga ggcccacggc 14820 

aagtatttgg gcaaggggtc gctggtattc gtgcagggca agattcggaa taccaagtac 14880 

gagaaggacg gccagacggt ctacgggacc gacttcattg ccgataaggt ggattatctg 14940 

gacaccaagg caccaggcgg gtcaaatcag gaataagggc acattgcccc ggcgtgagtc 15000 

ggggcaatcc cgcaaggagg gtgaatgaat cggacgtttg accggaaggc atacaggcaa 15060 

gaactgatcg acgcggggtt ttccgccgag gatgccgaaa ccatcgcaag ccgcaccgtc 15120 

atgcgtgcgc cccgcgaaac cttccagtcc gtcggctcga tggtccagca agctacggcc 15180 

aagatcgagc gcgacagcgt gcaactggct ccccctgccc tgcccgcgcc atcggccgcc 15240 

gtggagcgtt cgcgtcgtct cgaacaggag gcggcaggtt tggcgaagtc gatgaccatc 15300 
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gacacgcgag gaactatgac gaccaagaag cgaaaaaccg ccggcgagga cctggcaaaa 15360 

caggtcagcg aggccaagca ggccgcgttg ctgaaacaca cgaagcagca gatcaaggaa 15420 

atgcagcttt ccttgttcga tattgcgccg tggccggaca cgatgcgagc gatgccaaac 15480 

gacacggccc gctctgccct gttcaccacg cgcaacaaga aaatcccgcg cgaggcgctg 15540 

caaaacaagg tcattttcca cgtcaacaag gacgtgaaga tcacctacac cggcgtcgag 15600 

ctgcgggccg acgatgacga actggtgtgg cagcaggtgt tggagtacgc gaagcgcacc 15660 

cctatcggcg agccgatcac cttcacgttc tacgagcttt gccaggacct gggctggtcg 15720 

atcaatggcc ggtattacac gaaggccgag gaatgcctgt cgcgcctaca ggcgacggcg 15780 

atgggcttca cgtccgaccg cgttgggcac ctggaatcgg tgtcgctgct gcaccgcttc 15840 

cgcgtcctgg accgtggcaa gaaaacgtcc cgttgccagg tcctgatcga cgaggaaatc 15900 

gtcgtgctgt ttgctggcga ccactacacg aaattcatat gggagaagta ccgcaagctg 15960 

tcgccgacgg cccgacggat gttcgactat ttcagctcgc accgggagcc gtacccgctc 16020 

aagctggaaa ccttccgcct catgtgcgga tcggattcca cccgcgtgaa gaagtggcgc 16080 

gagcaggtcg gcgaagcctg cgaagagttg cgaggcagcg gcctggtgga acacgcctgg 16140 

gtcaatgatg acctggtgca ttgcaaacgc tagggccttg tggggtcagt tccggctggg 16200 

ggttcagcag ccagcgcttt actggcattt caggaacaag cgggcactgc tcgacgcact 16260 

tgcttcgctc agtatcgctc gggacgcacg gcgcgctcta cgaactgccg ataaacagag 16320 

gattaaaatt gacaattgtg attaaggctc agattcgacg gcttggagcg gccgacgtgc 16380 

aggatttccg cgagatccga ttgtcggccc tgaagaaagc tccagagatg ttcgggtccg 16440 

tttacgagca cgaggagaaa aagcccatgg aggcgttcgc tgaacggttg cgagatgccg 16500 

tggcattcgg cgcctacatc gacggcgaga tcattgggct gtcggtcttc aaacaggagg 16560 
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acggccccaa ggacgctcac aaggcgcatc tgtccggcgt tttcgtggag cccgaacagc 16620 

gaggccgagg ggtcgccggt atgctgctgc gggcgttgcc ggcgggttta ttgctcgtga 16680 

tgatcgtccg acagattcca acgggaatct ggtggatgcg catcttcatc ctcggcgcac 16740 

ttaatatttc gctattctgg agcttgttgt ttatttcggt ctaccgcctg ccgggcgggg 16800 

tcgcggcgac ggtaggcgct gtgcagccgc tgatggtcgt gttcatctct gccgctctgc 16860 

taggtagccc gatacgattg atggcggtcc tgggggctat ttgcggaact gcgggcgtgg 16920 

cgctgttggt gttgacacca aacgcagcgc tagatcctgt cggcgtcgca gcgggcctgg 16980 

cgggggcggt ttccatggcg fctcggaaccg tgctgacccg caagtggcaa cctcccgtgc 17040 

ctctgctcac ctttaccgcc tggcaactgg cggccggagg acttctgctc gttccagtag 17100 

ctttagtgtt tgatccgcca atcccgatgc ctacaggaac caatgttctc ggcctggcgt 17160 

ggctcggcct gatcggagcg ggtttaacct acttcctttg gttccggggg atctcgcgac 17220 

tcgaacctac agttgtttcc ttactgggct ttctcagccc cagatctggg gtcgatcagc 172 80 

cggggatgca tcaggccgac agtcggaact tcgggtcccc gacctgtacc attcggtgag 17340 

caatggatag gggagttgat atcgtcaacg ttcacttcta aagaaatagc gccactcagc 17400 

ttcctcagcg gctttatcca gcgatttcct attatgtcgg catagttctc aagatcgaca 17460 

gcctgtcacg gttaagcgag aaatgaataa gaaggctgat aattcggatc tctgcgaggg 17520 

agatgatatt tgatcacagg cagcaacgct ctgtcatcgt tacaatcaac atgctaccct 17580 

ccgcgagatc atccgtgttt caaacccggc agcttagttg ccgttcttcc gaatagcatc 17640 

ggtaacatga gcaaagtctg ccgccttaca acggctctcc cgctgacgcc gtcccggact 17700 

gatgggctgc ctgtatcgag tggtgatttt gtgccgagct gccggtcggg gagctgttgg 177 60 

ctggctggtg gcaggatata ttgtggtgta aacaaattga cgcttagaca acttaataac 17820 
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acattgcgga cgtttttaat gtactggggt ggtttttctt ttcaccagtg agacgggcaa 17880 

cagctgattg cccttcaccg cctggccctg agagagttgc agcaagcggt ccacgctggt 17940 

ttgccccagc aggcgaaaat cctgtttgat ggtggttccg aaatcggcaa aatcccttat 18000 

aaatcaaaag aatagcccga gatagggttg agtgttgttc cagtttggaa caagagtcca 18060 

ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc 18120 

ccactacgtg aaccatcacc caaatcaagt tttttggggt cgaggtgccg taaagcacta 18180 

aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg 18240 

gcgagaaagg aagggaagaa agcgaaagga gcgggcgcca ttcaggctgc gcaactgttg 183 00 

ggaagggcga tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc 18360 

tgcaaggcga ttaagttggg taacgccagg gttttcccag tcacgacgtt gtaaaacgac 18420 

ggccagtgaa ttcgagctcg gtacccggg 18449 



<210> 42 

<211> 17593 

<212> DNA 

<213> Artificial 

<220> 

<223> Plasmid 
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<220> 

<221> misc_feature 
<222> (10563) . . (10563) 
<223> n is a, c, g, or t 

<400> 42 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 60 

aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 

aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480 

ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540 

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 

cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 660 

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 

atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 

ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 

ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 

gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 

acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 
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acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 

agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 

ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 1260 

ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 

atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 

agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 

agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 

cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 

ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 

gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 

gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 

tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 

ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 

tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 

tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 

ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 

aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 

aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 

ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 

aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 

taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 
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tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 

tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 

catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 

tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 

tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 

attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 

cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 

ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 

agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 

cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 

tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 

attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 

tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180 

ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 

cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 

gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 

gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 

ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 

aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 
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gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 

gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 

tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720 

agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 3780 

tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 

ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 

tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 

acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 

tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 

acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 

accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg 4200 

gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 4260 

gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 

ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 

gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 

cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 

tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 

ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 

gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 

tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 

ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 
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gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 

catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 

tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 

cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 

tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 

ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 

cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 

attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 

accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 

ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 

cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 

gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 

agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 

ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 

cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 

tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 5760 

tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 5820 

cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca 5880 

caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 5940 

gtttcaaacc cggcagctta' gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000 

tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 
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cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 

tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 

taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 

accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 6300 

aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 6360 

ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 642 0 

actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 

cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 

agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 

cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 

tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 

ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 

cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 

gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 

gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 

aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 

aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 

aagaactgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 

cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 

tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 
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tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gtgaaccttt 7380 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 

tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 

gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 

tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 

tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 

gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 

atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 

cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 

ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 

tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 7980 

cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 

accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 

tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 

acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 

cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 

agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 

gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 

atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 

gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 

ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 
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cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 

tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 

aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 87 60 

cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 

tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 

ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 

gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 

tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 

ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 93 60 

accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 

ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 

ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 

gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 

aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 

cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 



WO 2004/063358 PCT/EP2004/000100 

178/358 

ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 

gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 

gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 

tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 

ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 

gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 

cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 102 60 

cttncaggct ccggcgaaga gaagaatagc ttagcagagc hattttcatt ttcgggagac 10320 

gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 

tccacgcgac tatatatttg tctctaattg tactttgaca tgctcctctt ctttactctg 10440 

atagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgcatgtt 10500 

tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 

canttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 

taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 

atgcacaggt acacttgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 10740 

gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgcaagctt ttttcgagtt 10800 

tttttttttt ttctttgtga aggatttatt gttattggta tccatttttt attggaagac 10860 

aagataagtt aatattgatt ttgcttaaag attaaaagga aatcagaaaa cgacaataaa 10920 

aaatgtaacg gacaaactat ggtgtcgatt ataagtctaa atccttaaaa aatgacaacg 10980 

agttgctttc ctctgaaaac aattcttttg tctttgcaag aaaggtttct tttttgtttg 11040 
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cttgcattac ttaaacatca aatcaaatga aaggaataaa gcagatttga gggcgaataa 11100 
ggattttctg gtcaacaaga tgtgagtgac acctaaggaa ctaaatgcca ttcatttgtt 11160 
ttaaaacgac atcaaagatt gatgatcaac aggattgaga gagagaaaaa gaactcgtgt 11220 
catttatttc tgttgactga aattttatat ttagaaaaaa tgtcaaatct atagctttag 11280 
ctatattaca taacatttga aataataata ataaaaaaag acacattaga gacacttttc 11340 
aaactctaaa taactgtcta taaacacaaa gaaaacaaag acctctataa caacttatta 11400 
gatttttctc gtacttttgt ctaaagatga tgtattcttg ttatcccaca cttctttcat 11460 
ttgttcttga tgctactaaa tatacaaaat ttcttttttg caagagatat tattccaaaa 11520 
attttcaaaa agaaattttt ttcacaatag cagttgatcg tgtaacccaa agaggttctt 11580 
tgttattttg cacttccgct ttgcggtgat gcatattcaa agtaatatat ggaataaaca 11640 
acgtgtttaa gcatgaaaga aaggaaacaa aggccgcttt gaacaaatgc ataatatttc 11700 
agacaaaaat gatctaaagc aagcagtaaa tcaaacaaga aacattgctg attcgcgtta 11760 
gaaaacgata aaagtctaat aagccactaa gtatacttca atgaactttt tgtatgctta 11820 
tggtccaatc agaccaataa tttgtgacca ttcctgaggt ggctttggtg atgcggaaac 11880 
agaaaaaaat tttctcacca atcgatttaa aaaacaattt ctgctttgaa ccaaaacttt 11940 
ttttttctct ttaatcatta actttatcaa gtatgtacct accctcaaag tcctcactca 12000 
agcacaatta tgctaacatt gttccacctt ctctttagaa atgttgtgga tttggaatgc 12060 
cctgatcgtt ttcgttaccg tgattggcat ggaagtgatt gctgcactgg cacacaaata 12120 
catcatgcac ggctggggtt ggggatggca tctttcacat catgaaccgc gtaaaggtgc 12180 
gtttgaagtt aacgatcttt atgccgtggt ttttgctgca ttatcgatcc tgctgattta 12240 
tctgggcagt acaggaatgt ggccgctcca gtggattggc gcaggtatga cggcgtatgg 12300 
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attactctat tttatggtgc acgacgggct ggtgcatcaa cgttggccat tccgctatat 12360 
tccacgcaag ggctacctca aacggttgta tatggcgcac cgtatgcatc acgccgtcag 12420 
gggcaaagaa ggttgtgttt cttttggctt cctctatgcg ccgcccctgt caaaacttca 12480 
ggcgacgctc cgggaaagac atggcgctag agcgggcgct gccagagatg cgcagggcgg 12540 
ggaggatgag cccgcatccg ggaagtaagg gcctgaccag aggcggccag cagcagcgtt 12600 
aatttttcgg gcgtggtcgt tgactgccgc tgatcccaaa gcttggcgta atcatggtca 12660 
tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat acgagccgga 12720 
agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt aattgcgttg 12780 
cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc 12840 
caacgcgcgg ggagaggcgg tttgcgtatt gggccaaaga caaaagggcg acattcaacc 12900 
gattgaggga gggaaggtaa atattgacgg aaattattca ttaaaggtga attatcaccg 12960 
tcaccgactt gagccatttg ggaattagag ccagcaaaat caccagtagc accattacca 13 020 
ttagcaaggc cggaaacgtc accaatgaaa ccatcgatag cagcaccgta atcagtagcg 13080 
acagaatcaa gtttgccttt agcgtcagac tgtagcgcgt tttcatcggc attttcggtc 13140 
atagccccct tattagcgtt tgccatcttt tcataatcaa aatcaccgga accagagcca 13200 
ccaccggaac cgcctccctc agagccgcca ccctcagaac cgccaccctc agagccacca 13260 
ccctcagagc cgccaccaga accaccacca gagccgccgc cagcattgac aggaggcccg 13320 
atctagtaac atagatgaca ccgcgcgcga taatttatcc tagtttgcgc gctatatttt 13380 
gttttctatc gcgtattaaa tgtataattg cgggactcta atcataaaaa cccatctcat 13440 
aaataacgtc atgcattaca tgttaattat tacatgctta ac^taattca acagaaatta 13500 
tatgataatc atcgcaagac cggcaacagg attcaatctt aagaaacttt attgccaaat 13560 
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gtttgaacga tcggggatca tccgggtctg tggcgggaac tccacgaaaa tatccgaacg 13620 
cagcaagata tcgcggtgca tctcggtctt gcctgggcag tcgccgccga cgccgttgat 13 680 
gtggacgccg ggcccgatca tattgtcgct caggatcgtg gcgttgtgct tgtcggccgt 13740 
tgctgtcgta atgatatcgg caccttcgac cgcctgttcc gcagagatcc cgtgggcgaa 13800 
gaactccagc atgagatccc cgcgctggag gatcatccag ccggcgtccc ggaaaacgat 13 860 
tccgaagccc aacctttcat agaaggcggc ggtggaatcg aaatctcgtg atggcaggtt 13920 
gggcgtcgct tggtcggtca tttcgaaccc cagagtcccg ctcagaagaa ctcgtcaaga 13980 
aggcgataga aggcgatgcg ctgcgaatcg ggagcggcga taccgtaaag cacgaggaag 14040 
cggtcagccc attcgccgcc aagctcttca gcaatatcac gggtagccaa cgctatgtcc 14100 
tgatagcggt ccgccacacc cagccggcca cagtcgatga atccagaaaa gcggccattt 14160 
tccaccatga tattcggcaa gcaggcatcg ccatgggtca cgacgagatc atcgccgtcg 14220 
ggcatgcgcg ccttgagcct ggcgaacagt tcggctggcg cgagcccctg atgctcttcg 14280 
tccagatcat cctgatcgac aagaccggct tccatccgag tacgtgctcg ctcgatgcga 14340 
tgtttcgctt ggtggtcgaa tgggcaggta gccggatcaa gcgtatgcag ccgccgcatt 14400 
gcatcagcca tgatggatac tttctcggca ggagcaaggt gagatgacag gagatcctgc 14460 

cccggcactt cgcccaatag cagccagtcc cttcccgctt cagtgacaac gtcgagcaca 14520 

gctgcgcaag gaacgcccgt cgtggccagc cacgatagcc gcgctgcctc gtcctgcagt 14580 

tcattcaggg caccggacag gtcggtcttg acaaaaagaa ccgggcgccc ctgcgctgac 14640 

agccggaaca cggcggcatc agagcagccg attgtctgtt gtgcccagtc atagccgaat 14700 

agcctctcca cccaagcggc cggagaacct gcgtgcaatc catcttgttc aatcatgcga 14760 

aacgatccag atccggtgca gattatttgg attgagagtg aatatgagac tctaattgga 14820 
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taccgagggg aatttatgga acgtcagtgg agcatttttg acaagaaata tttgctagct 14880 
gatagtgacc ttaggcgact tttgaacgcg caataatggt ttctgacgta tgtgcttagc 14940 
tcattaaact ccagaaaccc gcggctgagt ggctccttca acgttgcggt tctgtcagtt 15000 
ccaaacgtaa aacggcttgt cccgcgtcat cggcgggggt cataacgtga ctcccttaat 15060 
tctccgctca tgatcagatt gtcgtttccc gccttcagtt taaactatca gtgtttgaca 15120 
ggatatattg gcgggtaaac ctaagagaaa agagcgttta ttagaataat cggatattta 15180 
aaagggcgtg aaaaggttta tccgttcgtc catttgtatg tgcatgccaa ccacagggtt 15240 
ccccagatct ggcgccggcc agcgagacga gcaagattgg ccgccgcccg aaacgatccg 15300 
acagcgcgcc cagcacaggt gcgcaggcaa attgcaccaa cgcatacagc gccagcagaa 15360 
tgccatagtg ggcggtgacg tcgttcgagt gaaccagatc gcgcaggagg cccggcagca 15420 
ccggcataat caggccgatg ccgacagcgt cgagcgcgac agtgctcaga attacgatca 15480 
ggggtatgtt gggtttcacg tctggcctcc ggaccagcct ccgctggtcc gattgaacgc 15540 
gcggattctt tatcactgat aagttggtgg acatattatg tttatcagtg ataaagtgtc 15600 
aagcatgaca aagttgcagc cgaatacagt gatccgtgcc gccctggacc tgttgaacga 15660 
ggtcggcgta gacggtctga cgacacgcaa actggcggaa cggttggggg ttcagcagcc 15720 
ggcgctttac tggcacttca ggaacaagcg ggcgctgctc gacgcactgg ccgaagccat 15780 
gctggcggag aatcatacgc attcggtgcc gagagccgac gacgactggc gctcatttct 15840 
gatcgggaat gcccgcagct tcaggcaggc gctgctcgcc taccgcgatg gcgcgcgcat 15900 
ccatgccggc acgcgaccgg gcgcaccgca gatggaaacg gccgacgcgc agcttcgctt 15960 
cctctgcgag gcgggttttt cggccgggga cgccgtcaat gcgctgatga caatcagcta 16020 
cttcactgtt ggggccgtgc ttgaggagca ggccggcgac agcgatgccg gcgagcgcgg 16080 
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cggcaccgtt gaacaggctc cgctctcgcc gctgttgcgg gccgcgatag acgccttcga 16140 
cgaagccggt ccggacgcag cgttcgagca gggactcgcg gtgattgtcg atggattggc 16200 
gaaaaggagg ctcgttgtca ggaacgttga aggaccgaga aagggtgacg attgatcagg 16260 
accgctgccg gagcgcaacc cactcactac agcagagcca tgtagacaac atcccctccc 16320 
cctttccacc gcgtcagacg cccgtagcag cccgctacgg gctttttcat gccctgccct 16380 
agcgtccaag cctcacggcc gcgctcggcc tctctggcgg ccttctggcg ctcttccgct 16440 
tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac 16500 
tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 16560 
gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 16620 
aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 16680 
ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 16740 
gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 16800 
cttttccgct gcataaccct gcttcggggt cattatagcg attttttcgg tatatccatc 16860 
ctttttcgca cgatatacag gattttgcca aagggttcgt gtagactttc cttggtgtat 16920 
ccaacggcgt cagccgggca ggataggtga agtaggccca cccgcgagcg ggtgttcctt 16980 
cttcactgtc ccttattcgc acctggcggt gctcaacggg aatcctgctc tgcgaggctg 17040 
gccggctacc gccggcgtaa cagatgaggg caagcggatg gctgatgaaa ccaagccaac 17100 
caggaagggc agcccaccta tcaaggtgta ctgccttcca gacgaacgaa gagcgattga 17160 
ggaaaaggcg gcggcggccg gcatgagcct gtcggcctac ctgctggccg tcggccaggg 17220 
ctacaaaatc acgggcgtcg tggactatga gcacgtccgc gagctggccc gcatcaatgg 17280 
cgacctgggc cgcctgggcg gcctgctgaa actctggctc accgacgacc cgcgcacggc 17340 
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gcggttcggt gatgccacga tcctcgccct gctggcgaag atcgaagaga agcaggacga 
gcttggcaag gtcatpgatgg gcgtggtccg cccgagggca gagccatgac ttttttagcc 
gctaaaacgg ccggggggtg cgcgtgattg ccaagcacgt ccccatgcgc tccatcaaga 
agagcgactt cgcggagctg gtgaagtaca tcaccgacga gcaaggcaag accgagcgcc 
tttgcgacgc tea 
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<211> 16954 

<212> DNA 
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<222> (10563) . . (10563) 

<223> n is a, c, g, or t 

<400> 43 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 
aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 
aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 
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ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480 

ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540 

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 

cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 660 

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 

atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 

ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 
ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 
gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 

acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 

acgaagagga tgaagaggat gaggaggcag attgccttga atafeattgac aatactgata 1140 

agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 

ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 1260 

ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 

atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 

agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 



WO 2004/063358 PCT/EP2004/000100 

186/358 



agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 

cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 

ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 

gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 

gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 

tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 

ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 

tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 

tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 

ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040. 

aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 

aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 

ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 

aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 

taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 

tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 

tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 

catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 

tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 

tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 
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attggattac • ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 

cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 

ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 

agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 

cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 

tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 

attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 

tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180 

ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 

cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 

gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 

gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 

ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 

aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 

gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 

gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 

tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720 

agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 37 80 

tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 

ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 
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tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 

acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 

tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 

acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 

accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg 4200 

gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 4260 

gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 

ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 

gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 

cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 
tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 
ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 
gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 
tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 
ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 
gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 
catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 
tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 
cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 
tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 
ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 
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cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 

attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 

accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 

ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 

cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 

gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 

agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 

ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 

cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 

tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 5760 

tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 5820 

cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca 5880 

caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 5940 

gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000 

tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 

cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 

tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 

taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 

accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 6300 

aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 63 60 

ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 
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actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 

cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 

. agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 

cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 

tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 

ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 

cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 

gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 

gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 

aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 

aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 

aagaactgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 

cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 

tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 

tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gtgaaccttt 7380 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 

tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 

gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 

tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 
tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 
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gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 

attjtaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 

cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 

ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 

tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 7980 

cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 

accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 

tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 

acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 

cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 

agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 

gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 

atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 

gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 

ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 

cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 

tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 

aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 8760 

cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 

tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 
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ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 

ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 

gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 

tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 

ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 

accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 

ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 

ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 

gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 

aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 

cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 

ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 

gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 

gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 

tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 

ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 

gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 
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cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 10260 
cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt ttcgggagac 10320 
gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 
tccacgcgac tatatatttg tctctaattg tactttgaca tgctcctctt ctttactctg 10440 
atagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgcatgtt 10500 
tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 
canttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 
taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 
atgcacaggt acacttgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 10740 
gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgcaagctt gagattaaaa 10800 
tagataagga aaagaaagtg aaaagaaatt cggaagcatg gcacattctt ctttttataa 10860 
atacatgcct gactttcttt ttccatcgat atgatatatg catatgatag atatacaagc 10920 
aatcttcttc aaggagtttg aaattttgtc ctccaggagc aaaaaaaagt ttttttttat 10980 
acatgtttgt acacaagaat agttaccaat ttgctttggt cttacgtgct gcaagtttat 11040 
atcgttttca atttctttgt ctttacattt tctttgtcct ttatctttcc tcatttagtc 11100 

tttgggagaa ttaggaaaag ggagcggaaa ggtaagaaat gcttgcgtat tttactaatt 11160 

cggcaaacat ccaatttggc aaacagcagc ctgtgcaacg ctctcgagat gacagtatct 11220 

ttgattacac tctaaatctc gatgacccga ccaaaaagag cgaacaaaga aataatcttg 11280 

tgcattcgaa tatgatggaa gattttttcc cccttattct aaatgttgac atagcgtgta 11340 

tgttatataa acaaaaagaa attgtacaaa ctttcttttc ttctcttttt attttatctc 11400 
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tatgttgtgg atttggaatg ccctgatcgt tttcgttacc gtgattggca tggaagtgat 11460 
tgctgcactg gcacacaaat acatcatgca cggctggggt tggggatggc atctttcaca 11520 
tcatgaaccg cgtaaaggtg cgtttgaagt taacgatctt tatgccgtgg tttttgctgc 11580 
attatcgatc ctgctgattt atctgggcag tacaggaatg tggccgctcc agtggattgg 11640 
cgcaggtatg acggcgtatg gattactcta ttttatggtg cacgacgggc tggtgcatca 11700 
acgttggcca ttccgctata ttccacgcaa gggctacctc aaacggttgt atatggcgca 11760 
ccgtatgcat cacgccgtca ggggcaaaga aggttgtgtt tcttttggct tcctctatgc 11820 
gccgcccctg tcaaaacttc aggcgacgct ccgggaaaga catggcgcta gagcgggcgc 11880 
tgccagagat gcgcagggcg gggaggatga gcccgcatcc gggaagtaag ggcctgacca 11940 
gaggcggcca gcagcagcgt taatttttcg ggcgtggtcg ttgactgccg ctgatcccaa 12000 
agcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc gctcacaatt 12060 
ccacacaaca tacgagccgg aagcataaag tgtaaagcct ggggtgccta atgagtgagc 12120 
taactcacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc 12180 
cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat tgggccaaag 12240 
acaaaagggc gacattcaac cgattgaggg agggaaggta aatattgacg gaaattattc 12300 
attaaaggtg aattatcacc gtcaccgact tgagccattt gggaattaga gccagcaaaa 12360 
tcaccagtag caccattacc attagcaagg ccggaaacgt caccaatgaa accatcgata 12420 
gcagcaccgt aatcagtagc gacagaatca agtttgcctt tagcgtcaga ctgtagcgcg 12480 
ttttcatcgg cattttcggt catagccccc ttattagcgt ttgccatctt ttcataatca 12540 
aaatcaccgg aaccagagcc accaccggaa ccgcctccct cagagccgcc accctcagaa 12600 
ccgccaccct cagagccacc accctcagag ccgccaccag aaccaccacc agagccgccg 12660 
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ccagcattga caggaggccc gatctagtaa catagatgac accgcgcgcg ataatttatc 12720 
ctagtttgcg cgctatattt tgttttctat cgcgtattaa atgtataatt gcgggactct 12780 
aatcataaaa acccatctca taaataacgt catgcattac atgttaatta ttacatgctt 12840 
aacgtaattc aacagaaatt atatgataat catcgcaaga ccggcaacag gattcaatct 12900 
taagaaactt tattgccaaa tgtttgaacg atcggggatc atccgggtct gtggcgggaa 12960 
ctccacgaaa atatccgaac gcagcaagat atcgcggtgc atctcggtct tgcctgggca 13020 
gtcgccgccg acgccgttga tgtggacgcc gggcccgatc atattgtcgc tcaggatcgt 13080 
ggcgttgtgc ttgtcggccg ttgctgtcgt aatgatatcg gcaccttcga ccgcctgttc 13140 
cgcagagatc ccgtgggcga agaactccag catgagatcc ccgcgctgga ggatcatcca 13200 
gccggcgtcc cggaaaacga ttccgaagcc caacctttca tagaaggcgg cggtggaatc 13260 
gaaatctcgt gatggcaggt tgggcgtcgc ttggtcggtc atttcgaacc ccagagtccc 13320 
gctcagaaga actcgtcaag aaggcgatag aaggcgatgc gctgcgaatc gggagcggcg 13380 
ataccgtaaa gcacgaggaa gcggtcagcc cattcgccgc caagctcttc agcaatatca 13440 
cgggtagcca acgctatgtc ctgatagcgg tccgccacac ccagccggcc acagtcgatg 13500 
aatccagaaa agcggccatt ttccaccatg atattcggca agcaggcatc gccatgggtc 13560 
acgacgagat catcgccgtc gggcatgcgc gccttgagcc tggcgaacag ttcggctggc 13 620 
gcgagcccct gatgctcttc gtccagatca tcctgatcga caagaccggc ttccatccga 13680 
gtacgtgctc gctcgatgcg atgtttcgct tggtggtcga atgggcaggt agccggatca 13740 
agcgtatgca gccgccgcat tgcatcagcc atgatggata ctttctcggc aggagcaagg 13800 
tgagatgaca ggagatcctg ccccggcact tcgcccaata gcagccagtc ccttcccgct 13860 
tcagtgacaa cgtcgagcac agctgcgcaa ggaacgcccg tcgtggccag ccacgatagc 13920 
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cgcgctgcct cgtcctgcag ttcattcagg gcaccggaca ggtcggtctt gacaaaaaga 13980 
accgggcgcc cctgcgctga cagccggaac acggcggcat cagagcagcc gattgtctgt 14040 
tgtgcccagt catagccgaa tagcctctcc acccaagcgg ccggagaacc tgcgtgcaat 14100 
ccatcttgtt caatcatgcg aaacgatcca gatccggtgc agattatttg gattgagagt 14160 
gaatatgaga ctctaattgg ataccgaggg gaatttatgg aacgtcagtg gagcattttt 14220 
gacaagaaat atttgctagc tgatagtgac cttaggcgac ttttgaacgc gcaataatgg 14280 
tttctgacgt atgtgcttag ctcattaaac tccagaaacc cgcggctgag tggctccttc 14340 
aacgttgcgg ttctgtcagt tccaaacgta aaacggcttg tcccgcgtca tcggcggggg 14400 
tcataacgtg actcccttaa ttctccgctc atgatcagat tgtcgtttcc cgccttcagt 14460 
ttaaactatc agtgtttgac aggatatatt ggcgggtaaa cctaagagaa aagagcgttt 14520 
attagaataa tcggatattt aaaagggcgt gaaaaggttt atccgttcgt ccatttgtat 14580 
gtgcatgcca accacagggt tccccagatc tggcgccggc cagcgagacg agcaagattg 14640 
gccgccgccc gaaacgatcc gacagcgcgc ccagcacagg tgcgcaggca aattgcacca 14700 
acgcatacag cgccagcaga atgccatagt gggcggtgac gtcgttcgag tgaaccagat 14760 
cgcgcaggag gcccggcagc apcggcataa tcaggccgat gccgacagcg tcgagcgcga 14820 
cagtgctcag aattacgatc aggggtatgt tgggtttcac gtctggcctc cggaccagcc 14880 
tccgctggtc cgattgaacg cgcggattct ttatcactga taagttggtg gacatattat 14940 

gtttatcagt gataaagtgt caagcatgac aaagttgcag ccgaatacag tgatccgtgc 15000 

cgccctggac ctgttgaacg aggtcggcgt agacggtctg acgacacgca aactggcgga 15060 

acggttgggg gttcagcagc cggcgcttta ctggcacttc aggaacaagc gggcgctgct 15120 

cgacgcactg gccgaagcca tgctggcgga gaatcatacg cattcggtgc cgagagccga 15180 
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cgacgactgg cgctcatttc tgatcgggaa tgcccgcagc ttcaggcagg cgctgctcgc 15240 
ctaccgcgat ggcgcgcgca tccatgccgg cacgcgaccg ggcgcaccgc agatggaaac 15300 
ggccgacgcg cagcttcgct tcctctgcga ggcgggtttt tcggccgggg acgccgtcaa 15360 
tgcgctgatg acaatcagct acttcactgt tggggccgtg cttgaggagc aggccggcga 15420 
cagcgatgcc ggcgagcgcg gcggcaccgt tgaacaggct ccgctctcgc cgctgttgcg 15480 
ggccgcgata gacgccttcg acgaagccgg tccggacgca gcgttcgagc agggactcgc 15540 
ggtgattgtc gatggattgg cgaaaaggag gctcgttgtc aggaacgttg aaggaccgag 15600 
aaagggtgac gattgatcag gaccgctgcc ggagcgcaac ccactcacta cagcagagcc 15660 
atgtagacaa catcccctcc ccctttccac cgcgtcagac gcccgtagca gcccgctacg 15720 
ggctttttca tgccctgccc tagcgtccaa gcctcacggc cgcgctcggc ctctctggcg 15780 
gccttctggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg 15840 
cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat 15900 
aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc 15960 
gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc 16020 
tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga 16080 
agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt 16140 
ctcccttcgg gaagcgtggc gcttttccgc tgcataaccc tgcttcgggg tcattatagc 16200 
gattttttcg gtatatccat cctttttcgc acgatataca ggattttgcc aaagggttcg 16260 
tgtagacttt ccttggtgta tccaacggcg tcagccgggc aggataggtg aagtaggccc 16320 
acccgcgagc gggtgttcct tcttcactgt cccttattcg cacctggcgg tgctcaacgg 16380 
gaatcctgct ctgcgaggct ggccggctac cgccggcgta acagatgagg gcaagcggat 16440 
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ggctgatgaa accaagccaa ccaggaaggg cagcccacct atcaaggtgt actgccttcc 16500 

agacgaacga agagcgattg aggaaaaggc ggcggcggcc ggcatgagcc tgtcggccta 16560 

cctgctggcc gtcggccagg gctacaaaat cacgggcgtc gtggactatg agcacgtccg 16620 

cgagctggcc cgcatcaatg gcgacctggg ccgcctgggc ggcctgctga aactctggct 16680 

caccgacgac ccgcgcacgg cgcggttcgg tgatgccacg atcctcgccc tgctggcgaa 16740 

gatcgaagag aagcaggacg agcttggcaa ggtcatgatg ggcgtggtcc gcccgagggc 16800 

agagccatga cttttttagc cgctaaaacg gccggggggt gcgcgtgatt gccaagcacg 16860 

tccccatgcg ctccatcaag aagagcgact tcgcggagct ggtgaagtac atcaccgacg 16920 

agcaaggcaa gaccgagcgc ctttgcgacg ctca 16954 

<210> 44 

<211> 16954 

<212> DNA 

<213> Artificial 

<220> 

<223> Plasmid 
<220> 

<221> misc_feature 

<222> (10264) . . (10264) 

<223> n is a, c, g, or t 

<220> 
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<223> n is a, c, g, or t 
<400> 44 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 60 

aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 

aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 3 60 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480 

ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540 

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 

cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 660 

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 

atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 

ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 

ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 

gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 

acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 

acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 
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agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 
ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 1260 
ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 
atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 
agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 
agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 
cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 
ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 
gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 
gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 
tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 
ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 
tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 
tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 
ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 
aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 
aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 
ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 
aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 
taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 
tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 
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tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 

catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 

tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 

tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 

attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 

cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2 820 

ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 

agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 

cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 

tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 

attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 
tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180 
ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 
cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 
gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 
gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 
ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 
aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 
gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 
gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 
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tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720 

agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 3780 

tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 

ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 

tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 

acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 

tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 

acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 

accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg 4200 

gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 4260 

gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 

ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 

gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 

cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 

tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 

ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 

gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 
tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 
ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 
gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 
catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 
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tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 

cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 

tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 

ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 

cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 

attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 

accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 

ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 

cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 

gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 

agcgggttta acc tact tec tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 

ttccttactg ggctttctca gccccagatc tggggtcgat cagcegggga tgeatcagge 5640 

egacagtegg aacttegggt ccccgacctg taccattegg tgagcaatgg ataggggagt 5700 

tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc ageggcttta 5760 

tecagegatt tcctattatg teggcatagt tctcaagatc gaeagectgt cacggttaag 5820 

cgagaaatga ataagaaggc tgataattcg gatctctgeg agggagatga tatttgatca 5880 

caggcagcaa cgctctgtca tcgttacaat caacatgeta ccctccgcga gatcatccgt 5940 

gtttcaaacc eggcagctta gttgccgttc ttccgaatag categgtaac atgagcaaag 6000 

tctgccgcct tacaaegget ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 

cgagtggtga ttttgtgccg agetgeeggt eggggagctg ttggctggct ggtggcagga 6120 

tatattgtgg tgtaaacaaa ttgaegctta gacaacttaa taacacattg cggacgtttt 6180 
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taatgtactg gggtggtttt fccttttcacc agtgagacgg gcaacagctg attgcccttc 6240 

accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 6300 

aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 6360 

ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 

actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 

cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 

agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 

cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 

tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 

ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 

cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 

gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 

gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 

aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7 080 

aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 

aagaactgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 

cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 

tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 

tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gtgaaccttt 7380 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 
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tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 

gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 

tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 

tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 

gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 

atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 

cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 

ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 

tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 7980 

cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 

accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 

tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 

acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 

cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 82 80 

agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 

gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 

atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 

gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 

ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 

cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 
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tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 

aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 8760 

cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 

tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 

ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 

gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 

tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 

ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 

accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 

ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 

ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 

gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 

aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 

cttggttgac ggcaatttcg atgatgcagc . ttgggcgcag ggtcgatgcg acgcaatcgt 9840 
ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 
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gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 
gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 
tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 
ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 
gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 
cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 10260 
cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt ttcgggagac 10320 
gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 
tccacgcgac tatatatttg tctctaattg tactttgaca tgctcctctt ctttactctg 10440 
atagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgcatgtt 10500 
tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 
canttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 
taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 
atgcacaggt acacttgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 10740 
gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgcaagctt agagataaaa 10800 
taaaaagaga agaaaagaaa gtttgtacaa tttctttttg tttatataac atacacgcta 10860 
tgtcaacatt tagaataagg gggaaaaaat cttccatcat attcgaatgc acaagattat 10920 
ttctttgttc gctctttttg gtcgggtcat cgagatttag agtgtaatca aagatactgt 10980 
catctcgaga gcgttgcaca ggctgctgtt tgccaaattg gatgtttgcc gaattagtaa 11040 
aatacgcaag catttcttac ctttccgctc ccttttccta attctcccaa agactaaatg 11100 
aggaaagata aaggacaaag aaaatgtaaa gacaaagaaa ttgaaaacga tataaacttg 11160 
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cagcacgtaa gaccaaagca aattggtaac tattcttgtg tacaaacatg tataaaaaaa 11220 

aacttttttt tgctcctgga ggacaaaatt tcaaactcct tgaagaagat tgcttgtata 11280 

tctatcatat gcatatatca tatcgatgga aaaagaaagt caggcatgta tttataaaaa 11340 

gaagaatgtg ccatgcttcc gaatttcttt tcactttctt ttccttatct attttaatct 11400 

catgttgtgg atttggaatg ccctgatcgt tttcgttacc gtgattggca tggaagtgat 11460 

tgctgcactg gcacacaaat acatcatgca cggctggggt tggggatggc atctttcaca 11520 

tcatgaaccg cgtaaaggtg cgtttgaagt taacgatctt tatgccgtgg tttttgctgc 11580 

attatcgatc ctgctgattt atctgggcag tacaggaatg tggccgctcc agtggattgg 11640 

cgcaggtatg acggcgtatg gattactcta ttttatggtg cacgacgggc tggtgcatca 11700 

acgttggcca ttccgctata ttccacgcaa gggctacctc aaacggttgt atatggcgca 11760 

ccgtatgcat cacgccgtca ggggcaaaga aggttgtgtt tcttttggct tcctctatgc 11820 

gccgcccctg tcaaaacttc aggcgacgct ccgggaaaga catggcgcta gagcgggcgc 11880 

tgccagagat gcgcagggcg gggaggatga gcccgcatcc gggaagtaag ggcctgacca 11940 

gaggcggcca gcagcagcgt taatttttcg ggcgtggtcg ttgactgccg ctgatcccaa 12000 

agcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc gctcacaatt 12060 

ccacacaaca tacgagccgg aagcataaag tgtaaagcct ggggtgccta atgagtgagc 12120 

taactcacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc 12180 

cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat tgggccaaag 12240 

acaaaagggc gacattcaac cgattgaggg agggaaggta aatattgacg gaaattattc 12300 

attaaaggtg aattatcacc gtcaccgact tgagccattt gggaattaga gccagcaaaa 12360 

tcaccagtag caccattacc attagcaagg ccggaaacgt caccaatgaa accatcgata 12420 
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gcagcaccgt aatcagtagc gacagaatca agtttgcctt tagcgtcaga ctgtagcgcg 12480 
ttttcatcgg cattttcggt catagccccc ttattagcgt ttgccatctt ttcataatca 12540 
aaatcaccgg aaccagagcc accaccggaa ccgcctccct cagagccgcc accctcagaa 12600 
ccgccaccct cagagccacc accctcagag ccgccaccag aaccaccacc agagccgccg 12660 
ccagcattga caggaggccc gatctagtaa catagatgac accgcgcgcg ataatttatc 12720 
ctagtttgcg cgctatattt tgttttctat cgcgtattaa atgtataatt gcgggactct 12780 
aatcataaaa acccatctca taaataacgt catgcattac atgttaatta ttacatgctt 12840 
aacgtaattc aacagaaatt atatgataat catcgcaaga ccggcaacag gattcaatct 12900 
taagaaactt tattgccaaa tgtttgaacg atcggggatc atccgggtct gtggcgggaa 12960 
ctccacgaaa atatccgaac gcagcaagat atcgcggtgc atctcggtct tgcctgggca 13020 
gtcgccgccg acgccgttga tgtggacgcc gggcccgatc atattgtcgc tcaggatcgt 13080 
ggcgttgtgc ttgtcggccg ttgctgtcgt aatgatatcg gcaccttcga ccgcctgttc 13140 
cgcagagatc ccgtgggcga agaactccag catgagatcc ccgcgctgga ggatcatcca 13200 
gccggcgtcc cggaaaacga ttccgaagcc caacctttca tagaaggcgg cggtggaatc 13260 
gaaatctcgt gatggcaggt tgggcgtcgc ttggtcggtc atttcgaacc ccagagtccc 13320 
gctcagaaga actcgtcaag aaggcgatag aaggcgatgc gctgcgaatc gggagcggcg 13380 
ataccgtaaa gcacgaggaa gcggtcagcc cattcgccgc caagctcttc agcaatatca 13440 
cgggtagcca acgctatgtc ctgatagcgg tccgccacac ccagccggcc acagtcgatg 13500 
aatccagaaa agcggccatt ttccaccatg atattcggca agcaggcatc gccatgggtc 13560 
acgacgagat catcgccgtc gggcatgcgc gccttgagcc tggcgaacag ttcggctggc 13620 
gcgagcccct gatgctcttc gtccagatca tcctgatcga caagaccggc ttccatccga 13680 
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gtacgtgctc gctcgatgcg atgtttcgct tggtggtcga atgggcaggt agccggatca 13740 
agcgtatgca gccgccgcat tgcatcagcc atgatggata ctttctcggc aggagcaagg 13800 
tgagatgaca ggagatcctg ccccggcact tcgcccaata gcagccagtc ccttcccgct 13860 
tcagtgacaa cgtcgagcac agctgcgcaa ggaacgcccg tcgtggccag ccacgatagc 13920 
cgcgctgcct cgtcctgcag ttcattcagg gcaccggaca ggtcggtctt gacaaaaaga 13980 
accgggcgcc cctgcgctga cagccggaac acggcggcat cagagcagcc gattgtctgt 14040 
tgtgcccagt catagccgaa tagcctctcc acccaagcgg ccggagaacc tgcgtgcaat 14100 
ccatcttgtt caatcatgcg aaacgatcca gatccggtgc agattatttg gattgagagt 14160 
gaatatgaga ctctaattgg ataccgaggg gaatttatgg aacgtcagtg gagcattttt 14220 
gacaagaaat atttgctagc tgatagtgac cttaggcgac ttttgaacgc gcaataatgg 14280 
tttctgacgt atgtgcttag ctcattaaac tccagaaacc cgcggctgag tggctccttc 14340 
aacgttgcgg ttctgtcagt tccaaacgta aaacggcttg tcccgcgtca tcggcggggg 14400 
tcataacgtg actcccttaa ttctccgctc atgatcagat tgtcgtttcc cgccttcagt 14460 
ttaaactatc agtgtttgac aggatatatt ggcgggtaaa cctaagagaa aagagcgttt 14520 
attagaataa tcggatattt aaaagggcgt gaaaaggttt atccgttcgt ccatttgtat 14580 
gtgcatgcca accacagggt tccccagatc tggcgccggc cagcgagacg agcaagattg 14640 
gccgccgccc gaaacgatcc gacagcgcgc ccagcacagg tgcgcaggca aattgcacca 14700 
acgcatacag cgccagcaga atgccatagt gggcggtgac gtcgttcgag tgaaccagat 14760 
cgcgcaggag gcccggcagc accggcataa tcaggccgat gccgacagcg tcgagcgcga 14820 
cagtgctcag aattacgatc aggggtatgt tgggtttcac gtctggcctc cggaccagcc 14880 
tccgctggtc cgattgaacg cgcggattct ttatcactga taagttggtg gacatattat 14940 
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gtttatcagt gataaagtgt caagcatgac aaagttgcag ccgaatacag tgatccgtgc 15000 

cgccctggac ctgttgaacg aggtcggcgt agacggtctg acgacacgca aactggcgga 15060 

acggttgggg gttcagcagc cggcgcttta ctggcacttc aggaacaagc gggcgctgct 15120 

cgacgcactg gccgaagcca tgctggcgga gaatcatacg cattcggtgc cgagagccga 15180 

cgacgactgg cgctcatttc tgatcgggaa tgcccgcagc ttcaggcagg cgctgctcgc 15240 

ctaccgcgat ggcgcgcgca tccatgccgg cacgcgaccg ggcgcaccgc agatggaaac 15300 

ggccgacgcg cagcttcgct tcctctgcga ggcgggtttt tcggccgggg acgccgtcaa 15360 

tgcgctgatg acaatcagct acttcactgt tggggccgtg cttgaggagc aggccggcga 15420 

cagcgatgcc ggcgagcgcg gcggcaccgt tgaacaggct ccgctctcgc cgctgttgcg 15480 

ggccgcgata gacgccttcg acgaagccgg tccggacgca gcgttcgagc agggactcgc 15540 

ggtgattgtc gatggattgg cgaaaaggag gctcgttgtc aggaacgttg aaggaccgag 15600 

aaagggtgac gattgatcag gaccgctgcc ggagcgcaac ccactcacta cagcagagcc 15660 

atgtagacaa catcccctcc ccctttccac cgcgtcagac gcccgtagca gcccgctacg 15720 

ggctttttca tgccctgccc tagcgtccaa gcctcacggc cgcgctcggc ctctctggcg 15780 

gccttctggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg 15840 

cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat 15900 

aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc 15960 

gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc 16020 

tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga 16080 

agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt 16140 
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ctcccttcgg gaagcgtggc gcttttccgc tgcataaccc tgcttcgggg tcattatagc 16200 
gattttttcg gtatatccat cctttttcgc acgatataca ggattttgcc aaagggttcg 16260 
tgtagacttt ccttggtgta tccaacggcg tcagccgggc aggataggtg aagtaggccc 16320 
acccgcgagc gggtgttcct tcttcactgt cccttattcg cacctggcgg tgctcaacgg 16380 
gaatcctgct ctgcgaggct ggccggctac cgccggcgta acagatgagg gcaagcggat 16440 
ggctgatgaa accaagccaa ccaggaaggg cagcccacct atcaaggtgt actgccttcc 16500 
agacgaacga agagcgattg aggaaaaggc ggcggcggcc ggcatgagcc tgtcggccta 16560 
cctgbtggcc gtcggccagg gctacaaaat cacgggcgtc gtggactatg agcacgtccg 16620 
cgagctggcc cgcatcaatg gcgacctggg ccgcctgggc ggcctgctga aactctggct 16680 
caccgacgac ccgcgcacgg cgcggttcgg tgatgccacg atcctcgccc tgctggcgaa 16740 
gatcgaagag aagcaggacg agcttggcaa ggtcatgatg ggcgtggtcc gcccgagggc 16800 
agagccatga cttttttagc cgctaaaacg gccggggggt gcgcgtgatt gccaagcacg 16860 
tccccatgcg ctccatcaag aagagcgact tcgcggagct ggtgaagtac atcaccgacg 16920 
agcaaggcaa gaccgagcgc ctttgcgacg ctca 16954 



<210> 45 

<211> 19491 

<212> DNA 

<213> Artificial 

<220> 

<223> Plasmid 
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<223> n is a, c, g, or t 
<220> 

<221> misc_f eature 
<222> (19178) (19178) 
<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (19269) . . (19269) 

<223> n is a, c, g, or t 

<400> 45 

agcttggtac cgagctcgga tccactagta acggccgcca gtgtgctgga attcgccctt 60 

gacggccagt gaattcgagc tcggtacccg gggatctttc gacactgaaa tacgtcgagc 120 

ctgctccgct tggaagcggc gaggagcctc gtcctgtcac aactaccaac atggagtacg 180 

ataagggcca gttccgccag ctcattaaga gccagttcat gggcgttggc atgatggccg 240 

tcatgcatct gtacttcaag tacaccaacg ctcttctgat ccagtcgatc atccgctgaa 300 

ggcgctttcg aatctggtta agatccacgt cttcgggaag ccagcgactg gtgacctcca 3 60 

gcgtcccttt aaggctgcca acagctttct cagccagggc cagcccaaga ccgacaaggc 420 

ctccctccag aacgccgaga agaactggag gggtggtgtc aaggaggagt aagctcctta 480 

ttgaagtcgg aggacggagc ggtgtcaaga ggatattctt cgactctgta ttatagataa 540 

gatgatgagg aattggaggt agcatagctt catttggatt tgctttccag gctgagactc 600 
tagcttggag catagagggt cctttggctt tcaatattct caagtatctc gagtttgaac 660 
ttattccctg tgaacctttt attcaccaat gagcattgga atgaacatga atctgaggac 720 
tgcaatcgcc atgaggtttt cgaaatacat ccggatgtcg aaggcttggg gcacctgcgt 780 
tggttgaatt tagaacgtgg cactattgat catccgatag ctctgcaaag ggcgttgcac 840 
aatgcaagtc aaacgttgct agcagttcca ggtggaatgt tatgatgagc attgtattaa 900 
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atcaggagat atagcatgat ctctagttag ctcaccacaa aagtcagacg gcgtaaccaa 960 

aagtcacaca acacaagctg taaggatttc ggcacggcta cggaagacgg agaagccacc 1020 

ttcagtgga'c tcgagtacca tttaattcta tttgtgtttg atcgagacct aatacagccc 1080 

ctacaacgac catcaaagtc gtatagctac cagtgaggaa gtggactcaa atcgacttca 1140 

gcaacatctc ctggataaac tttaagccta aactatacag aataagatag gtggagagct 1200 

tataccgagc tcccaaatct gtccagatca tggttgaccg gtgcctggat cttcctatag 12 60 

aatcatcctt attcgttgac ctagctgatt ctggagtgac ccagagggtc atgacttgag 1320 

cctaaaatcc gccgcctcca ccatttgtag aaaaatgtga cgaactcgtg agctctgtac 1380 

agtgaccggt gactctttct ggcatgcgga gagacggacg gacgcagaga gaagggctga 1440 

gtaataagcc actggccaga cagctctggc ggctctgagg tgcagtggat gattattaat 1500 

ccgggaccgg ccgcccctcc gccccgaagt ggaaaggctg gtgtgcccct cgttgaccaa 1560 

gaatctattg catcatcgga gaatatggag cttcatcgaa tcaccggcag taagcgaagg 1620 

agaatgtgaa gccaggggtg tatagccgtc ggcgaaatag catgccatta acctaggtac 1680 

agaagtccaa ttgcttccga tctggtaaaa gattcacgag atagtacctt ctccgaagta 1740 
ggtagagcga gtacccggcg cgtaagctcc ctaattggcc catccggcat ctgtagggcg 1800 
tccaaatatc gtgcctctcc tgctttgccc ggtgtatgaa accggaaagg ccgctcagga 1860 

gctggccagc ggcgcagacc gggaacacaa gctggcagtc gacccatccg gtgctctgca 1920 
ctcgacctgc tgaggtccct cagtccctgg taggcagctt tgccccgtct gtccgcccgg 1980 
tgtgtcggcg gggttgacaa ggtcgttgcg tcagtccaac atttgttgcc atattttcct 2040 
gctctcccca ccagctgctc ttttcttttc tctttctttt cccatcttca gtatattcat 2100 
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cttcccatcc aagaaccttt atttccccta agtaagtact ttgctacatc catactccat 2160 

ccttcccatc ccttattcct ttgaaccttt cagttcgagc tttcccactt catcgcagct 2220 

tgactaacag ctaccccgct tgagcagaca tcaccatgct gtcgaagctg cagtcaatca 2280 

gcgtcaaggc ccgccgcgtt gaactagccc gcgacatcac gcggcccaaa gtctgcctgc 2340 

atgctcagcg gtgctcgtta gttcggctgc gagtggcagc accacagaca gaggaggcgc 2400 

tgggaaccgt gcaggctgcc ggcgcgggcg atgagcacag cgccgatgta gcactccagc 2460 

agcttgaccg ggctatcgca gagcgtcgfcg cccggcgcaa acgggagcag ctgtcatacc 2520 

aggctgccgc cattgcagca tcaattggcg tgtcaggcat tgccatcttc gccacctacc 2580 

tgagatttgc catgcacatg accgtgggcg gcgcagtgcc atggggtgaa gtggctggca 2640 

ctctcctctt ggtggttggt ggcgcgctcg gcatggagat gtatgcccgc tatgcacaca 2700 

aagccatctg gcatgagtcg cctctgggct ggctgctgca caagagccac cacacacctc 2760 

gcactggacc ctttgaagcc aacgacttgt ttgcaatcat caatggactg cccgccatgc 2820 

tcctgtgtac ctttggcttc tggctgccca acgtcctggg ggcggcctgc tttggagcgg 2880 

ggctgggcat cacgctatac ggcatggcat atatgtttgt acacgatggc ctggtgcaca 2940 

ggcgctttcc caccgggccc atcgctggcc tgccctacat gaagcgcctg acagtggccc 3000 

accagctaca ccacagcggc aagtacggtg gcgcgccctg gggtatgttc ttgggtccac 3060 

aggagctgca gcacattcca ggtgcggcgg aggaggtgga gcgactggtc ctggaactgg 3120 

actggtccaa gcggtagggt gcggaaccag gcacgctggt ttcacacctc atgcctgtga 3180 

taaggtgtgg ctagagcgat gcgtgtgaga cgggtatgtc acggtcgact ggtctgatgg 3240 

ccaatggcat cggccatgtc tggtcatcac gggctggttg cctgggtgaa ggtgatgcac 3300 

atcatcatgt gcggttggag gggctggcac agtgtgggct gaactggagc agttgtccag 3360 
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gctggcgttg aatcagtgag ggtttgtgat tggcggttgt gaagcaatga ctccgcccat 3420 

attctatttg tgggagctga gatgatggca tgcttgggat gtgcatggat catggtagtg 3480 

cagcaaacta tattcaccta gggctgttgg taggatcagg tgaggccttg cacattgcat 3540 

gatgtactcg tcatggtgtg ttggtgagag gatggatgtg gatggatgtg tattctcaga 3600 

cgtagacctt gactggaggc ttgatcgaga gagtgggccg tattctttga gaggggaggc 3 660 

tcgtgccaga aatggtgagt ggatgactgt gacgctgtac attgcaggca ggtgagatgc 3720 

actgtctcga ttgtaaaata cattcagatg caagcttggc gtaatcatgg tcatagctgt 3780 

ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc ggaagcataa 3840 

agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg ttgcgctcac 3900 

tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg 3960 

cggggagagg cggtttgcgt attgggccaa agacaaaagg gcgacattca accgattgag 4020 
ggagggaagg taaatattga cggaaattat tcattaaagg tgaattatca ccgtcaccga 4080 
cttgagccat ttgggaatta gagccagcaa aatcaccagt agcaccatta ccattagcaa 4140 
ggccggaaac gtcaccaatg aaaccatcga tagcagcacc gtaatcagta gcgacagaat 4200 
caagtttgcc tttagcgtca gactgtagcg cgttttcatc ggcattttcg gtcatagccc 4260 
ccttattagc gtttgccatc ttttcataat caaaatcacc ggaaccagag ccaccaccgg 4320 
aaccgcctcc ctcagagccg ccaccctcag aaccgccacc ctcagagcca ccaccctcag 4380 
agccgccacc agaaccacca ccagagccgc cgccagcatt gacaggaggc ccgatctagt 4440 
aacatagatg acaccgcgcg cgataattta tcctagtttg cgcgctatat tttgttttct 4500 
atcgcgtatt aaatgtataa ttgcgggact ctaatcataa aaacccatct cataaataac 4560 
gtcatgcatt acatgttaat tattacatgc ttaacgtaat tcaacagaaa ttatatgata 4620 
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atcatcgcaa gaccggcaac aggattcaat cttaagaaac tttattgcca aatgtttgaa 4680 

cgatcgggga tcatccgggt ctgtggcggg aactccacga aaatatccga acgcagcaag 4740 

atatcgcggt gcatctcggt cttgcctggg cagtcgccgc cgacgccgtt gatgtggacg 4800 

ccgggcccga tcatattgtc gctcaggatc gtggcgttgt gcttgtcggc cgttgctgtc 4860 

gtaatgatat cggcaccttc gaccgcctgt tccgcagaga tcccgtgggc gaagaactcc 4920 

agcatgagat ccccgcgctg gaggatcatc cagccggcgt cccggaaaac gattccgaag 4980 

cccaaccttt catagaaggc ggcggtggaa tcgaaatctc gtgatggcag gttgggcgtc 5040 

gcttggtcgg tcatttcgaa ccccagagtc ccgctcagaa gaactcgtca agaaggcgat 5100 

agaaggcgat gcgctgcgaa tcgggagcgg cgataccgta aagcacgagg aagcggtcag 5160 

cccattcgcc gccaagctct tcagcaatat cacgggtagc caacgctatg tcctgatagc 5220 

ggtccgccac acccagccgg ccacagtcga tgaatccaga aaagcggcca ttttccacca 5280 

tgatattcgg caagcaggca tcgccatggg tcacgacgag atcatcgccg tcgggcatgc 5340 

gcgccttgag cctggcgaac agttcggctg gcgcgagccc ctgatgctct tcgtccagat 5400 

catcctgatc gacaagaccg gcttccatcc gagtacgtgc tcgctcgatg cgatgtttcg 5460 

cttggtggtc gaatgggcag gtagccggat caagcgtatg cagccgccgc attgcatcag 5520 

ccatgatgga tactttctcg gcaggagcaa ggtgagatga caggagatcc tgccccggca 5580 

cttcgcccaa tagcagccag tcccttcccg cttcagtgac aacgtcgagc acagctgcgc 5640 
aaggaacgcc cgtcgtggcc agccacgata gccgcgctgc ctcgtcctgc agt teat tea 5700 

gggcaccgga caggteggtc ttgacaaaaa gaaccgggcg cccctgcgct gaeagcegga 5760 
acacggcggc atcagagcag ccgattgtct gttgtgccca gtcatagccg aatagectet 5820 
ccacccaagc ggccggagaa cctgcgtgca atccatcttg ttcaatcatg cgaaacgatc 5880 
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cagatccggt gcagattatt tggattgaga gtgaatatga gactctaatt ggataccgag 5940 

gggaatttat ggaacgtcag tggagcattt ttgacaagaa atatttgcta gctgatagtg 6000 

i 

accttaggcg acttttgaac gcgcaataat ggtttctgac gtatgtgctt agctcattaa 6060 

actccagaaa cccgcggctg agtggctcct tcaacgttgc ggttctgtca gttccaaacg 6120 

taaaacggct tgtcccgcgt catcggcggg ggtcataacg tgactccctt aattctccgc 6180 

tcatgatcag attgtcgttt cccgccttca gtttaaacta tcagtgtttg acaggatata 6240 

ttggcgggta aacctaagag aaaagagcgt ttattagaat aatcggatat ttaaaagggc 6300 

gtgaaaaggt ttatccgttc gtccatttgt atgtgcatgc caaccacagg gttccccaga 6360 

tctggcgccg gccagcgaga cgagcaagat tggccgccgc ccgaaacgat ccgacagcgc 6420 

gcccagcaca ggtgcgcagg caaattgcac caacgcatac agcgccagca gaatgccata 6480 

gtgggcggtg acgtcgttcg agtgaaccag atcgcgcagg aggcccggca gcaccggcat 6540 

aatcaggccg atgccgacag cgtcgagcgc gacagtgctc agaattacga tcaggggtat 6600 

gttgggtttc acgtctggcc tccggaccag cctccgctgg tccgattgaa cgcgcggatt 6660 
ctttatcact gataagttgg tggacatatt atgtttatca gtgataaagt gtcaagcatg 6720 
acaaagttgc agccgaatac agtgatccgt gccgccctgg acctgttgaa cgaggtcggc 6780 
gtagacggtc tgacgacacg caaactggcg gaacggttgg gggttcagca gccggcgctt 6840 
tactggcact tcaggaacaa gcgggcgctg ctcgacgcac tggccgaagc catgctggcg 6900 
gagaatcata cgcattcggt gccgagagcc gacgacgact ggcgctcatt tctgatcggg 6960 
aatgcccgca gcttcaggca ggcgctgctc gcctaccgcg atggcgcgcg catccatgcc 7020 
ggcacgcgac cgggcgcacc gcagatggaa acggccgacg cgcagcttcg cttcctctgc 7080 
gaggcgggtt tttcggccgg ggacgccgtc aatgcgctga tgacaatcag ctacttcact 7140 
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gttggggccg tgcttgagga gcaggccggc gacagcgatg ccggcgagcg cggcggcacc 7200 

gttgaacagg ctccgctctc gccgctgttg cgggccgcga tagacgcctt cgacgaagcc 7260 

ggtccggacg cagcgttcga gcagggactc gcggtgattg tcgatggatt ggcgaaaagg 7320 

aggctcgttg tcaggaacgt tgaaggaccg agaaagggtg acgattgatc aggaccgctg 7380 

ccggagcgca acccactcac tacagcagag ccatgtagac aacatcccct ccccctttcc 7440 

accgcgtcag acgcccgtag cagcccgcta cgggcttttt catgccctgc cctagcgtcc 7500 

aagcctcacg gccgcgctcg gcctctctgg cggccttctg gcgctcttcc gcttcctcgc 7560 

tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 7620 

cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 7680 

gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 7740 

gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 7800 

gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 7860 

ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgcttttcc 7920 

gctgcataac cctgcttcgg ggtcattata gcgatttttt cggtatatcc atcctttttc 7980 

gcacgatata caggattttg ccaaagggtt cgtgtagact ttccttggtg tatccaacgg 8040 

cgtcagccgg gcaggatagg tgaagtaggc ccaeccgcga gcgggtgttc cttcttcact 8100 

gtcccttatt cgcacctggc ggtgctcaac gggaatcctg ctctgcgagg ctggccggct 8160 

accgccggcg taacagatga gggcaagcgg atggctgatg aaaccaagcc aaccaggaag 8220 

ggcagcccac ctatcaaggt gtactgcctt ccagacgaac gaagagcgat tgaggaaaag 8280 

gcggcggcgg ccggcatgag cctgtcggcc tacctgctgg ccgtcggcca gggctacaaa 8340 

atcacgggcg tcgtggacta tgagcacgtc cgcgagctgg cccgcatcaa tggcgacctg 8400 
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ggccgcctgg gcggcctgct gaaactctgg ctcaccgacg acccgcgcac ggcgcggttc 8460 

ggtgatgcca cgatcctcgc cctgctggcg aagatcgaag agaagcagga cgagcttggc 8520 

aaggtcatga tgggcgtggt ccgcccgagg gcagagccat gactttttta gccgctaaaa 8580 

cggccggggg gtgcgcgtga ttgccaagca cgtccccatg cgctccatca agaagagcga 8640 

cttcgcggag ctggtgaagt acatcaccga cgagcaaggc aagaccgagc gcctttgcga 8700 

cgctcaccgg gctggttgcc ctcgccgctg ggctggcggc cgtctatggc cctgcaaacg 8760 

cgccagaaac gccgtcgaag ccgtgtgcga gacaccgcgg ccgccggcgt tgtggatacc 8820 

tcgcggaaaa cttggccctc actgacagat gaggggcgga cgttgacact tgaggggccg 8880 

actcacccgg cgcggcgttg acagatgagg ggcaggctcg atttcggccg gcgacgtgga 8940 

gctggccagc ctcgcaaatc ggcgaaaacg cctgatttta cgcgagtttc ccacagatga 9000 

tgtggacaag cctggggata agtgccctgc ggtattgaca cttgaggggc gcgactactg 9060 

acagatgagg ggcgcgatcc ttgacacttg aggggcagag tgctgacaga tgaggggcgc 9120 

acctattgac atttgagggg ctgtccacag gcagaaaatc cagcatttgc aagggtttcc 9180 

gcccgttttt cggccaccgc taacctgtct tttaacctgc ttttaaacca atatttataa 9240 

accttgtttt taaccagggc tgcgccctgt gcgcgtgacc gcgcacgccg aaggggggtg 9300 

cccccccttc tcgaaccctc ccggcccgct aacgcgggcc tcccatcccc ccaggggctg 9360 

cgcccctcgg ccgcgaacgg cctcacccca aaaatggcag cgctggcagt ccttgccatt 9420 

gccgggatcg gggcagtaac gggatgggcg atcagcccga gcgcgacgcc cggaagcatt 9480 

gacgtgccgc aggtgctggc atcgacattc agcgaccagg tgccgggcag tgagggcggc 9540 

ggcctgggtg gcggcctgcc cttcacttcg gccgtcgggg cattcacgga cttcatggcg 9600 
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gggccggcaa tttttacctt gggcattctt ggcatagtgg tcgcgggtgc cgtgctcgtg 9660 

ttcgggggtg cgataaaccc agcgaaccat ttgaggtgat aggtaagatt ataccgaggt 9720 

atgaaaacga gaattggacc tttacagaat tactctatga agcgccatat ttaaaaagct 9780 

accaagacga agaggatgaa gaggatgagg aggcagattg ccttgaatat attgacaata 9840 

ctgataagat aatatatctt ttatatagaa gatatcgccg tatgtaagga tttcaggggg 9900 

caaggcatag gcagcgcgct tatcaatata tctatagaat gggcaaagca taaaaacttg 9960 

catggactaa tgcttgaaac ccaggacaat aaccttatag cttgtaaatt ctatcataat 10020 

tgggtaatga ctccaactta ttgatagtgt tttatgttca gataatgccc gatgactttg 10080 

i 

tcatgcagct ccaccgattt tgagaacgac agcgacttcc gtcccagccg tgccaggtgc 10140 

tgcctcagat tcaggttatg ccgctcaatt cgctgcgtat atcgcttgct gattacgtgc 10200 

agctttccct tcaggcggga ttcatacagc ggccagccat ccgtcatcca tatcaccacg 10260 

tcaaagggtg acagcaggct cataagacgc cccagcgtcg ccatagtgcg ttcaccgaat 10320 

acgtgcgcaa caaccgtctt ccggagactg tcatacgcgt aaaacagcca gcgctggcgc 10380 

gatttagccc cgacatagcc ccactgttcg tccatttccg cgcagacgat gacgtcactg 10440 

cccggctgta tgcgcgaggt taccgactgc ggcctgagtt ttttaagtga cgtaaaatcg 10500 

tgttgaggcc aacgcccata atgcgggctg ttgcccggca tccaacgcca ttcatggcca 10560 

tatcaatgat tttctggtgc gtaccgggtt gagaagcggt gtaagtgaac tgcagttgcc 10620 

atgttttacg gcagtgagag cagagatagc gctgatgtcc ggcggtgctt ttgccgttac 10680 

gcaccacccc gtcagtagct gaacaggagg gacagctgat agacacagaa gccactggag 10740 

cacctcaaaa acaccatcat acactaaatc agtaagttgg cagcatcacc cataattgtg 10800 

gtttcaaaat cggctccgtc gatactatgt tatacgccaa ctttgaaaac aactttgaaa 10860 
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aagctgtttt ctggtattta aggttttaga atgcaaggaa cagtgaattg gagttcgtct 10920 
tgttataatt agcttcttgg ggtatcttta aatactgtag aaaagaggaa ggaaataata 10980 
aatggctaaa atgagaatat caccggaatt gaaaaaactg atcgaaaaat accgctgcgt 11040 
aaaagatacg gaaggaatgt ctcctgctaa ggtatataag ctggtgggag aaaatgaaaa 11100 
cctatattta aaaatgacgg acagccggta taaagggacc acctatgatg tggaacggga 11160 
aaaggacatg atgctatggc tggaaggaaa gctgcctgtt ccaaaggtcc tgcactttga 11220 
acggcatgat ggctggagca atctgctcat gagtgaggcc gatggcgtcc tttgctcgga 11280 
agagtatgaa gatgaacaaa gccctgaaaa gattatcgag ctgtatgcgg agtgcatcag 11340 
gctctttcac tccatcgaca tatcggattg tccctatacg aatagcttag acagccgctt 11400 
agccgaattg gattacttac tgaataacga tctggccgat gtggattgcg aaaactggga 11460 
agaagacact ccatttaaag atccgcgcga gctgtatgat tttttaaaga cggaaaagcc 11520 
cgaagaggaa cttgtctttt cccacggcga cctgggagac agcaacatct ttgtgaaaga 11580 
tggcaaagta agtggcttta ttgatcttgg gagaagcggc agggcggaca agtggtatga 11640 
cattgccttc tgcgtccggt cgatcaggga ggatatcggg gaagaacagt atgtcgagct 11700 
attttttgac ttactgggga tcaagcctga ttgggagaaa ataaaatatt atattttact 11760 
ggatgaattg ttttagtacc tagatgtggc gcaacgatgc cggcgacaag caggagcgca 11820 
ccgacttctt ccgcatcaag tgttttggct ctcaggccga ggcccacggc aagtatttgg 11880 
gcaaggggtc gctggtattc gtgcagggca agattcggaa taccaagtac gagaaggacg 11940 
gccagacggt ctacgggacc gacttcattg ccgataaggt ggattatctg gacaccaagg 12000 
caccaggcgg gtcaaatcag gaataagggc acattgcccc ggcgtgagtc ggggcaatcc 12060 
cgcaaggagg gtgaatgaat cggacgtttg accggaaggc atacaggcaa gaactgatcg 12120 
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acgcggggtt ttccgccgag gatgccgaaa ccatcgcaag ccgcaccgtc atgcgtgcgc 12180 
cccgcgaaac cttccagtcc gtcggctcga tggtccagca agctacggcc aagatcgagc 12240 
gcgacagcgt gcaactggct ccccctgccc tgcccgcgcc atcggccgcc gtggagcgtt 12300 
cgcgtcgtct cgaacaggag gcggcaggtt tggcgaagtc gatgaccatc gacacgcgag 12360 
gaactatgac gaccaagaag cgaaaaaccg ccggcgagga cctggcaaaa caggtcagcg 12420 
aggccaagca ggccgcgttg ctgaaacaca cgaagcagca gatcaaggaa atgcagcttt 12480 
ccttgttcga tattgcgccg tggccggaca cgatgcgagc gatgccaaac gacacggccc 12540 
gctctgccct gttcaccacg cgcaacaaga aaatcccgcg cgaggcgctg caaaacaagg 12600 
tcattttcca cgtcaacaag gacgtgaaga tcacctacac cggcgtcgag ctgcgggccg 12660 
acgatgacga actggtgtgg cagcaggtgt tggagtacgc gaagcgcacc cctatcggcg 12720 
agccgatcac cttcacgttc tacgagcttt gccaggacct gggctggtcg atcaatggcc 12780 
ggtattacac gaaggccgag gaatgcctgt cgcgcctaca ggcgacggcg atgggcttca 12840 
cgtccgaccg cgttgggcac ctggaatcgg tgtcgctgct gcaccgcttc cgcgtcctgg 12900 
accgtggcaa gaaaacgtcc cgttgccagg tcctgatcga cgaggaaatc gtcgtgctgt 12960 
ttgctggcga ccactacacg aaattcatat gggagaagta ccgcaagctg tcgccgacgg 13020 
cccgacggat gttcgactat ttcagctcgc accgggagcc gtacccgctc aagctggaaa 13080 
ccttccgcct catgtgcgga tcggattcca cccgcgtgaa gaagtggcgc gagcaggtcg 13140 
gcgaagcctg cgaagagttg cgaggcagcg gcctggtgga acacgcctgg gtcaatgatg 13200 
acctggtgca ttgcaaacgc tagggccttg tggggtcagt tccggctggg ggttcagcag 13260 
ccagcgcttt actggcattt caggaacaag cgggcactgc tcgacgcact tgcttcgctc 13320 
agtatcgctc gggacgcacg gcgcgctcta cgaactgccg ataaacagag gattaaaatt 13380 
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gacaattgtg attaaggctc agattcgacg gcttggagcg gccgacgtgc aggatttccg 13440 
cgagatccga ttgtcggccc tgaagaaagc tccagagatg ttcgggtccg tttacgagca 13500 
cgaggagaaa aagcccatgg aggcgttcgc tgaacggttg cgagatgccg tggcattcgg 13560 
cgcctacatc gacggcgaga tcattgggct gtcggtcttc aaacaggagg acggccccaa 13620 
ggacgctcac aaggcgcatc tgtccggcgt tttcgtggag cccgaacagc gaggccgagg 13680 
ggtcgccggt atgctgctgc gggcgttgcc ggcgggttta ttgctcgtga tgatcgtccg 13740 
acagattcca acgggaatct ggtggatgcg catcttcatc ctcggcgcac ttaatatttc 13800 
gctattctgg agcttgttgt ttatttcggt ctaccgcctg ccgggcgggg tcgcggcgac 13860 
ggtaggcgct gtgcagccgc tgatggtcgt gttcatctct gccgctctgc taggtagccc 13920 
gatacgattg atggcggtcc tgggggctat ttgcggaact gcgggcgtgg cgctgttggt 13980 
gttgacacca aacgcagcgc tagatcctgt cggcgtcgca gcgggcctgg cgggggcggt 14040 
ttccatggcg ttcggaaccg tgctgacccg caagtggcaa cctcccgtgc ctctgctcac 14100 
ctttaccgcc tggcaactgg cggccggagg acttctgctc gttccagtag ctttagtgtt 14160 
tgatccgcca atcccgatgc ctacaggaac caatgttctc ggcctggcgt ggctcggcct 14220 
gatcggagcg ggtttaacct acttcctttg gttccggggg atctcgcgac tcgaacctac 14280 
agttgtttcc ttactgggct ttctcagccc cagatctggg gtcgatcagc cggggatgca 14340 
tcaggccgac agtcggaact tcgggtcccc gacctgtacc attcggtgag caatggatag 14400 
gggagttgat atcgtcaacg ttcacttcta aagaaatagc gccactcagc ttcctcagcg 14460 
gctttatcca gcgatttcct attatgtcgg catagttctc aagatcgaca gcctgtcacg 14520 
gttaagcgag aaatgaataa gaaggctgat aattcggatc tctgcgaggg agatgatatt 14580 
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tgatcacagg cagcaacgct ctgtcatcgt tacaatcaac atgctaccct ccgcgagatc 14640 
atccgtgttt caaacccggc agcttagttg ccgttcttcc gaatagcatc ggtaacatga 14700 
gcaaagtctg ccgccttaca acggctctcc cgctgacgcc gtcccggact gatgggctgc 14760 
ctgtatcgag tggtgatttt gtgccgagct gccggtcggg gagctgttgg ctggctggtg- 14820 
gcaggatata ttgtggtgta aacaaattga cgcttagaca acttaataac acattgcgga 14880 
cgtttttaat gtactggggt ggtttttctt ttcaccagtg agacgggcaa cagctgattg 14940 
cccttcaccg cctggccctg agagagttgc agcaagcggt ccacgctggt ttgccccagc 15000 
aggcgaaaat cctgtttgat ggtggttccg aaatcggcaa aatcccttat aaatcaaaag 15060 
aatagcccga gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga 15120 
acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg 15180 
aaccatcacc caaatcaagt tttttggggt cgaggtgccg taaagcacta aatcggaacc 15240 
ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg 15300 
aagggaagaa agcgaaagga gcgggcgcca ttcaggctgc gcaactgttg ggaagggcga 15360 
tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc tgcaaggcga 15420 
ttaagttggg taacgccagg gttttcccag tcacgacgtt gtaaaacgac ggccagtgaa 15480 
ttcgagctcg gtacccgggg atctttcgac actgaaatac gtcgagcctg ctccgcttgg 15540 
aagcggcgag gagcctcgtc ctgtcacaac taccaacatg gagtacgata agggccagtt 15600 
ccgccagctc attaagagcc agttcatggg cgttggcatg atggccgtca tgcatctgta 15660 
cttcaagtac accaacgctc ttctgatcca gtcgatcatc cgctgaaggc gctttcgaat 15720 
ctggttaaga tccacgtctt cgggaagcca gcgactggtg acctccagcg tccctttaag 15780 
gctgccaaca gctttctcag ccagggccag cccaagaccg acaaggcctc cctccagaac 15840 
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gccgagaaga actggagggg tggtgtcaag gaggagtaag ctccttattg aagtcggagg 15900 
acggagcggt gtcaagagga tattcttcga ctctgtatta tagataagat gatgaggaat 15960 
tggaggtagc atagcttcat ttggatttgc tttccaggct gagactctag cttggagcat 16020 
agagggtcct ttggctttca atattctcaa gtatctcgag tttgaactta ttccctgtga 16080 
accttttatt caccaatgag cattggaatg aacatgaatc tgaggactgc aatcgccatg 16140 
aggttttcga aatacatccg gatgtcgaag gcttggggca cctgcgttgg ttgaatttag 16200 
aacgtggcac tattgatcat ccgatagctc tgcaaagggc gttgcacaat gcaagtcaaa 16260 
cgttgctagc agttccaggt ggaatgttat gatgagcatt gtattaaatc aggagatata 16320 
gcatgatctc tagttagctc accacaaaag tcagacggcg taaccaaaag tcacacaaca 16380 
caagctgtaa ggatttcggc acggctacgg aagacggaga agccaccttc agtggactcg 16440 
agtaccattt aattctattt gtgtttgatc gagacctaat acagccccta caacgaccat 16500 
caaagtcgta tagctaccag tgaggaagtg gactcaaatc gacttcagca acatctcctg 16560 
gataaacttt aagcctaaac tatacagaat aagataggtg gagagcttat accgagctcc 16620 
caaatctgtc cagatcatgg ttgaccggtg cctggatctt cctatagaat catccttatt 16680 
cgttgaccta gctgattctg gagtgaccca gagggtcatg acttgagcct aaaatccgcc 16740 
gcctccacca tttgtagaaa aatgtgacga actcgtgagc tctgtacagt gaccggtgac 16800 
tctttctggc atgcggagag acggacggac gcagagagaa gggctgagta ataagccact 16860 
ggccagacag ctctggcggc tctgaggtgc agtggatgat tattaatccg ggaccggccg 16920 
cccctccgcc ccgaagtgga aaggctggtg tgcccctcgt tgaccaagaa tctattgcat 16980 
catcggagaa tatggagctt catcgaatca ccggcagtaa gcgaaggaga atgtgaagcc 17040 
aggggtgtat agccgtcggc gaaatagcat gccattaacc taggtacaga agtccaattg 17100 
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cttccgatct ggtaaaagat tcacgagata gtaccttctc cgaagtaggt agagcgagta 17160 

cccggcgcgt aagctcccta attggcccat ccggcatctg tagggcgtcc aaatatcgtg 17220 

.cctctcctgc tttgcccggt gtatgaaacc ggaaaggccg ctcaggagct ggccagcggc 17280 

gcagaccggg aacacaagct ggcagtcgac ccatccggtg ctctgcactc gacctgctga 17340 

ggtccctcag tccctggtag gcagctttgc cccgtctgtc cgcccggtgt gtcggcgggg 17400 

ttgacaaggt cgttgcgtca gtccaacatt tgttgccata ttttcctgct ctccccacca 17460 

gctgctcttt tcttttctct ttcttttccc atcttcagta tattcatctt cccatccaag 17520 

aacctttatt tcccctaagt aagtactttg ctacatccat actccatcct tcccatccct 17580 

tattcctttg aacctttcag ttcgagcttt cccacttcat cgcagcttga ctaacagcta 17640 

ccccgcttga gcagacatca ccatgcctga actcaccgcg acgtctgtcg agaagtttct 17700 

gatcgaaaag ttcgacagcg tctccgacct gatgcagctc tcggagggcg aagaatctcg 17760 

tgctttcagc ttcgatgtag gagggcgtgg atatgtcctg cgggtaaata gctgcgccga 17820 

tggtttctac aaagatcgtt atgtttatcg gcactttgca tcggccgcgc tcccgattcc 17880 

ggaagtgctt gacattgggg aattcagcga gagcctgacc tattgcatct cccgccgtgc 17940 

acagggtgtc acgttgcaag acctgcctga aaccgaactg cccgctgttc tgcagccggt 18000 

cgcggaggcc atggatgcga tcgctgcggc cgatcttagc cagacgagcg ggttcggccc 18060 

attcggaccg caaggaatcg gtcaatacac tacatggcgt gatttcatat gcgcgattgc 18120 

tgatccccat gtgtatcact ggcaaactgt gatggacgac accgtcagtg cgtccgtcgc 18180 

gcaggctctc gatgagctga tgctttgggc cgaggactgc cccgaagtcc ggcacctcgt 18240 

gcacgcggat ttcggctcca acaatgtcct gacggacaat ggccgcataa cagcggtcat 18300 

tgactggagc gaggcgatgt tcggggattc ccaatacgag gtcgccaaca tcttcttctg 18360 
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gaggccgtgg ttggcttgta tggagcagca gacgcgctac ttcgagcgga ggcatccgga 18420 
gcttgcagga tcgccgcggc tccgggcgta tatgctccgc attggtcttg accaactcta 18480 
tcagagcttg gttgacggca atttcgatga tgcagcttgg gcgcagggtc gatgcgacgc 18540 
aatcgtccga tccggagccg ggactgtcgg gcgtacacaa atcgcccgca gaagcgcggc 18600 
cgtctggacc gatggctgtg tagaagtact cgccgatagt ggaaaccgac gccccagcac 18660 
tcgtccgagg gcaaaggaat agagtagatg ccgaccgcgg gatcgatcca cttaacgtta 18720 
ctgaaatcat caaacagctt gacgaatctg gatataagat cgttggtgtc gatgtcagct 18780 
ccggagttga gacaaatggt gttcaggatc tcgataagat acgttcattt gtccaagcag 18840 
caaagagtgc cttctagtga tttaatagct ccatgtcaac aagaataaaa cgcgttttcg 18900 
ggtttacctc ttccagatac agctcatctg caatgcatta atgcattgac tgcaacctag 18960 
taacgccttn caggctccgg cgaagagaag aatagcttag cagagctatt ttcattttcg 19020 
ggagacgaga tcaagcagat caacggtcgt caagagacct acgagactga ggaatccgct 19080 
cttggctcca cgcgactata tatttgtctc taattgtact ttgacatgct cctcttcttt 19140 
actctgatag cttgactatg aaaattccgt caccagcncc tgggttcgca aagataattg 19200 
catgtttctt ccttgaactc tcaagcctac aggacacaca ttcatcgtag gtataaacct 19260 
cgaaatcant tcctactaag atggtataca atagtaacca tgcatggttg cctagtgaat 19320 
gctccgtaac acccaatacg ccggccgaaa cttttttaca actctcctat gagtcgttta 19380 
cccagaatgc acaggtacac ttgtttagag gtaatccttc tttctagcta gaagtcctcg 19440 
tgtactgtgt aagcgcccac tccacatctc cactcgacct gcaggcatgc a 19491 

<210> 46 
<211> 21300 
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<212> DNA 

<213> Artificial 

<220> 

<223> Plasmid 



<220> 

<221> misc_ f eature 

<222> (3471) . . (3471) 

<223> n is a, c, g, or t 

<220> 

<221> misc_f eature 

<222> (3679) . . (3679) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (3770) . . (3770) 

<223> n is a # c, g, or t 

<400> 46 

gatctttcga cactgaaata cgtcgagcct gctccgcttg gaagcggcga ggagcctcgt 60 

cctgtcacaa ctaccaacat ggagtacgat aagggccagt tccgccagct cattaagagc 120 

cagttcatgg gcgttggcat gatggccgtc atgcatctgt acttcaagta caccaacgct 180 

cttctgatcc agtcgatcat ccgctgaagg cgctttcgaa tctggttaag atccacgtct 240 

tcgggaagcc agcgactggt gacctccagc gtccctttaa ggctgccaac agctttctca 3 00 

gccagggcca gcccaagacc gacaaggcct ccctccagaa cgccgagaag aactggaggg 360 

gtggtgtcaa ggaggagtaa gctccttatt gaagtcggag gacggagcgg tgtcaagagg 420 

atattcttcg actctgtatt atagataaga tgatgaggaa ttggaggtag catagcttca 480 

tttggatttg ctttccaggc tgagactcta gcttggagca tagagggtcc tttggctttc 540 



aatattctca agtatctcga gtttgaactt attccctgtg aaccttttat tcaccaatga 



600 
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gcattggaat gaacatgaat ctgaggactg caatcgccat gaggttttcg aaatacatcc 660 

ggatgtcgaa ggcttggggc acctgcgttg gttgaattta gaacgtggca ctattgatca 720 

tccgatagct ctgcaaaggg cgttgcacaa tgcaagtcaa acgttgctag cagttccagg 780 

tggaatgtta tgatgagcat tgtattaaat caggagatat agcatgatct ctagttagct 840 

caccacaaaa gtcagacggc gtaaccaaaa gtcacacaac acaagctgta aggatttcgg 900 

cacggctacg gaagacggag aagccacctt cagtggactc gagtaccatt taattctatt 960 

tgtgtttgat cgagacctaa tacagcccct acaacgacca tcaaagtcgt atagctacca 1020 

gtgaggaagt ggactcaaat cgacttcagc aacatctcct ggataaactt taagcctaaa 1080 

ctatacagaa taagataggt ggagagctta taccgagctc ccaaatctgt ccagatcatg 1140 

gttgaccggt gcctggatct tcctatagaa tcatccttat tcgttgacct agctgattct 1200 

ggagtgaccc agagggtcat gacttgagcc taaaatccgc cgcctccacc atttgtagaa 1260 

aaatgtgacg aactcgtgag ctctgtacag tgaccggtga ctctttctgg catgcggaga 1320 

gacggacgga cgcagagaga agggctgagt aataagccac tggccagaca gctctggcgg 13 80 

ctctgaggtg cagtggatga ttattaatcc gggaccggcc gcccctccgc cccgaagtgg 1440 

aaaggctggt gtgcccctcg ttgaccaaga atctattgca tcatcggaga atatggagct 1500 

tcatcgaatc accggcagta agcgaaggag aatgtgaagc caggggtgta tagccgtcgg 1560 

cgaaatagca tgccattaac ctaggtacag aagtccaatt gcttccgatc tggtaaaaga 1620 

ttcacgagat agtaccttct ccgaagtagg tagagcgagt acccggcgcg taagctccct 1680 
aattggccca tccggcatct gtagggcgtc caaatatcgt gcctctcctg ctttgcccgg 1740 
tgtatgaaac cggaaaggcc gctcaggagc tggccagcgg cgcagaccgg gaacacaagc 1800 
tggcagtcga cccatccggt gctctgcact cgacctgctg aggtccctca gtccctggta 1860 
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ggcagctttg ccccgtctgt ccgcccggtg tgtcggcggg gttgacaagg tcgttgcgtc 1920 

agtccaacat ttgttgccat attttcctgc tctccccacc agctgctctt ttcttttctc 1980 

tttcttttcc catcttcagt atattcatct tcccatccaa gaacctttat ttcccctaag 2040 

taagtacttt gctacatcca tactccatcc ttcccatccc ttattccttt gaacctttca 2100 

gttcgagctt tcccacttca tcgcagcttg actaacagct accccgcttg agcagacatc 2160 

accatgcctg aactcaccgc gacgtctgtc gagaagtttc tgatcgaaaa gttcgacagc 2220 

gtctccgacc tgatgcagct ctcggagggc gaagaatctc gtgctttcag cttcgatgta 2280 

ggagggcgtg gatatgtcct gcgggtaaat agctgcgccg atggtttcta caaagatcgt 2340 

tatgtttatc ggcactttgc atcggccgcg ctcccgattc cggaagtgct tgacattggg 2400 

gaattcagcg agagcctgac ctattgcatc tcccgccgtg cacagggtgt cacgttgcaa 2460 

gacctgcctg aaaccgaact gcccgctgtt ctgcagccgg tcgcggaggc catggatgcg 2520 

atcgctgcgg ccgatcttag ccagacgagc gggttcggcc cattcggacc gcaaggaatc 2580 

ggtcaataca ctacatggcg tgatttcata tgcgcgattg ctgatcccca tgtgtatcac 2640 

tggcaaactg tgatggacga caccgtcagt gcgtccgtcg cgcaggctct cgatgagctg 2700 

atgctttggg ccgaggactg ccccgaagtc cggcacctcg tgcacgcgga tttcggctcc 2760 

aacaatgtcc tgacggacaa tggccgcata acagcggtca ttgactggag cgaggcgatg 2820 

ttcggggatt cccaatacga ggtcgccaac atcttcttct ggaggccgtg gttggcttgt 2880 

atggagcagc agacgcgcta cttcgagcgg aggcatccgg agcttgcagg atcgccgcgg 2940 

ctccgggcgt atatgctccg cattggtctt gaccaactct atcagagctt ggttgacggc 3000 

aatttcgatg atgcagcttg ggcgcagggt cgatgcgacg caatcgtccg atccggagcc 3060 

gggactgtcg ggcgtacaca aatcgcccgc agaagcgcgg ccgtctggac cgatggctgt 3120 
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gtagaagtac tcgccgatag tggaaaccga cgccccagca ctcgtccgag ggcaaaggaa 3180 

tagagtagat gccgaccgcg ggatcgatcc acttaacgtt actgaaatca tcaaacagct 3240 

tgacgaatct ggatataaga tcgttggtgt cgatgtcagc tccggagttg agacaaatgg 3300 

tgttcaggat ctcgataaga tacgttcatt tgtccaagca gcaaagagtg ccttctagtg 3360 

atttaatagc tccatgtcaa caagaataaa acgcgttttc gggtttacct cttccagata 3420 

cagctcatct gcaatgcatt aatgcattga ctgcaaccta gtaacgcctt ncaggctccg 3480 

gcgaagagaa gaatagctta gcagagctat tttcattttc gggagacgag atcaagcaga 3 540 

tcaacggtcg tcaagagacc tacgagactg aggaatccgc tcttggctcc acgcgactat 3 600 

atatttgtct ctaattgtac tttgacatgc tcctcttctt tactctgata .gcttgactat 3660 

gaaaattccg tcaccagcnc ctgggttcgc aaagataatt gcatgtttct tccttgaact 3720 

ctcaagccta caggacacac attcatcgta ggtataaacc tcgaaatcan ttcctactaa 3780 

gatggtatac aatagtaacc atgcatggtt gcctagtgaa tgctccgtaa cacccaatac 3840 

gccggccgaa acttttttac aactctccta tgagtcgttt acccagaatg cacaggtaca 3900 

cttgtttaga ggtaatcctt ctttctagct agaagtcctc gtgtactgtg taagcgccca 3960 

ctccacatct ccactcgacc tgcaggcatg caagcttgaa ttcgagctcg gtacccgggg 4020 

atctttcgac actgaaatac gtcgagcctg ctccgcttgg aagcggcgag gagcctcgtc 4080 

ctgtcacaac taccaacatg gagtacgata agggccagtt ccgccagctc attaagagcc 4140 

• agttcatggg cgttggcatg atggccgtca tgcatctgta cttcaagtac accaacgctc 4200 

ttctgatcca gtcgatcatc cgctgaaggc gctttcgaat ctggttaaga tccacgtctt 4260 

cgggaagcca gcgactggtg acctccagcg tccctttaag gctgccaaca gctttctcag 4320 
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ccagggccag cccaagaccg acaaggcctc cctccagaac gccgagaaga actggagggg 4380 

tggtgtcaag gaggagtaag ctccttattg aagtcggagg acggagcggt gtcaagagga 4440 

tattcttcga ctctgtatta tagataagat gatgaggaat tggaggtagc atagcttcat 4500 

ttggatttgc tttccaggct gagactctag cttggagcat agagggtcct ttggctttca 4560 

atattctcaa gtatctcgag tttgaactta ttccctgtga accttttatt caccaatgag 4620 

cattggaatg aacatgaatc tgaggactgc aatcgccatg aggttttcga aatacatccg 4680 

gatgtcgaag gcttggggca cctgcgttgg ttgaatttag aacgtggcac tattgatcat 4740 

ccgatagctc tgcaaagggc gttgcacaat gcaagtcaaa cgttgctagc agttccaggt .4800 

ggaatgttat gatgagcatt gtattaaatc aggagatata gcatgatctc tagttagctc 4860 
accacaaaag tcagacggcg taaccaaaag tcacacaaca caagctgtaa ggatttcggc 4920 
acggctacgg aagacggaga agccaccttc agtggactcg agtaccattt aattctattt 4980 
gtgtttgatc gagacctaat acagccccta caacgaccat caaagtcgta tagctaccag 5040 
tgaggaagtg gactcaaatc gacttcagca acatctcctg gataaacttt aagcctaaac 5100 
tatacagaat aagataggtg gagagcttat accgagctcc caaatctgtc cagatcatgg 5160 
ttgaccggtg cctggatctt cctatagaat catccttatt cgttgaccta gctgattctg 5220 
gagtgaccca gagggtcatg acttgagcct aaaatccgcc gcctccacca tttgtagaaa 5280 
aatgtgacga actcgtgagc tctgtacagt gaccggtgac tctttctggc atgcggagag 5340 
acggacggac gcagagagaa gggctgagta ataagccact ggccagacag ctctggcggc 5400 
tctgaggtgc agtggatgat tattaatccg ggaccggccg cccctccgcc ccgaagtgga 5460 
aaggctggtg tgcccctcgt tgaccaagaa tctattgcat catcggagaa tatggagctt 5520 
catcgaatca ccggcagtaa gcgaaggaga atgtgaagcc aggggtgtat agccgtcggc 5580 
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gaaatagcat gccattaacc taggtacaga agtccaattg cttccgatct ggtaaaagat 5640 
tcacgagata gtaccttctc cgaagtaggt agagcgagta cccggcgcgt aagctcccta 5700 
attggcccat ccggcatctg tagggcgtcc aaatatcgtg cctctcctgc tttgcccggt 5760 
gtatgaaacc ggaaaggccg ctcaggagct ggccagcggc gcagaccggg aacacaagct 5820 
ggcagtcgac ccatccggtg ctctgcactc gacctgctga ggtccctcag tccctggtag 5880 
gcagctttgc cccgtctgtc cgcccggtgt gtcggcgggg ttgacaaggt cgttgcgtca 5940 
gtccaacatt tgttgccata ttttcctgct ctccccacca gctgctcttt tcttttctct 6000 
ttcttttccc atcttcagta tattcatctt cccatccaag aacctttatt tcccctaagt 6060 
aagtactttg ctacatccat actccatcct tcccatccct tattcctttg aacctttcag 6120 
ttcgagcttt cccacttcat cgcagcttga ctaacagcta ccccgcttga gcagacatca 6180 
ccatgtcaat actcacttat ctggaatttc atctctacta tacactacct gtccttgcgg 6240 
cattgtgttg gctgctaaag ccgtttcact cacagcaaga caatctcaag tataaatttt 6300 
taatgttgat ggccgcctct accgcatcga tttgggacaa ttatatcgtt tatcatcgcg 6360 
cttggtggta ctgtcctact tgtgttgtgg ctgtcattgg ctatgtacct ctagaagaat 6420 
acatgttctt tatcatcatg actttaatga ctgtcgcgtt ctcaaacttt gttatgcgtt 6480 
ggcacttgca tactttcttt attagaccca acacttcttg gaagcaaaca ctattagtac 6540 
gccttgtgcc tgtttcagct ttattggcaa tcacttatca tgcttggcac ttgacactgc 6600 
caaataaacc ttcattttat ggttcatgca tcctttggta tgcttgtcct gtgttggcta 6660 
ttctttggct gggtgctggc gaatatatct tgcgtcgacc tgtggctgtc cttttgtcta 6720 
ttgttatccc tagtgtatac ctatgttggg ctgatatcgt cgctattagt gctggcacat 6780 
ggcatatttc tcttagaaca agcactggca aaatggtagt acccgattta cctgtagaag 6840 
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aatgcctgtt ttttactttg atcaacacag tcttggtttt tgctacctgt gctatagacc 6900 
gcgctcaggc catcctccat gtgagcgcgc gtaatacgac tcactatagg gcgaattgga 6960 
gctccaccgc ggtggcggcc gctctagaac tagtggatcc cccgggctgc aggaattcgg 7020 
cacgagctac atttcacaag cccgtgagcg gtgcaagcgc tctgccccac atcggcccac 7080 
ctcctcatct ccatcggtca tttgctgcta ccacgatgct gtcgaagctg cagtcaatca 7140 
gcgtcaaggc ccgccgcgtt gaactagccc gcgacatcac gcggcccaaa gtctgcctgc 7200 
atgctcagcg gtgctcgtta gttcggctgc gagtggcagc accacagaca gaggaggcgc 72 60 
tgggaaccgt gcaggctgcc ggcgcgggcg atgagcacag cgccgatgta gcactccagc 7320 
agcttgaccg ggctatcgca gagcgtcgtg cccggcgcaa acgggagcag ctgtcatacc 7380 

aggctgccgc cattgcagca tcaattggcg tgtcaggcat tgccatcttc gccacctacc 7440 

tgagatttgc catgcacatg accgtgggcg gcgcagtgcc atggggtgaa gtggctggca 7500 

ctctcctctt ggtggttggt ggcgcgctcg gcatggagat gtatgcccgc tatgcacaca 7560 

aagccatctg gcatgagtcg cctctgggct ggctgctgca caagagccac cacacacctc 7620 

gcactggacc ctttgaagcc aacgacttgt ttgcaatcat caatggactg cccgccatgc 7680 

tcctgtgtac ctttggcttc tggctgccca acgtcctggg ggcggcctgc tttggagcgg. 7740 

ggctgggcat cacgctatac ggcatggcat atatgtttgt acacgatggc ctggtgcaca 7800 

ggcgctttcc caccgggccc atcgctggcc tgccctacat gaagcgcctg acagtggccc 7860 

accagctaca ccacagcggc aagtacggtg gcgcgccctg gggtatgttc ttgggtccac 7920 

aggagctgca gcacattcca ggtgcggcgg aggaggtgga gcgactggtc ctggaactgg 7980 

actggtccaa gcgggctcag gccatcctcc atctgtacaa atcatctgtt caaaatcaaa 8040 

accctaaaca agccatttcc cttttccagc atgtcaaaga gctagcatgg gccttctgtc 8100 
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ttcctgacca aatgctcaac aatgaattgt ttgatgatct tactatcagc tgggatattt 8160 

tacgtaaagc ctcaaagtca ttctatactg catctgccgt ttttccaagt tatgtacgtc 8220 

aagacttggg tgttctctat gctttctgca gagctaccga tgacctgtgc gatgatgaat 8280 

ccaaatctgt tcaagaaaga agagaccaat t agate ttac tcgacaattt gttcgtgatc 8340 

tetttageca aaagaccagt gcgcctattg tgattgattg ggaattgtat caaaaccaac 8400 

ttcctgcttc ttgtatatca gectttagag cctttactcg ccttcgccat gtccttgaag 8460 

tagaccctgt agaagaacta ttagatggtt acaaatggga tettgagegt cgtcctatcc 8520 

ttgatgaaca agacttggag gcatactctg cttgtgtggc cagtagtgtg ggtgaaatgt 8580 

gcacacgtgt gattcttget caagaccaaa aggaaaatga tgcttggata attgacegtg 8640 

caegtgagat ggggctggtg ctacaatacg ttaacattgc tcgagacatt gtgactgata 8700 

gegagactet gggtcgatgt tatctgcctc aacaatggct tagaaaagaa gaaacagaac 87 60 

aaatacagca aggcaacgcc egtagectag gtgatcaaag actgttgggc ttgtctctga 8820 

agcttgtagg aaaggcagac gctatcatgg tgagagctaa gaagggcatt gacaagttgc 8880 

eggcaaactg teaaggeggt gtacgagctg ettgecaagt atatgetgea attggatctg 8940 

tactcaagca gcagaagaca acatatccta caagagctca tctaaaagga agegaaegtg 9000 

ecaagattge tctgttgagt gtatacaacc tctatcaatc tgaagacaag cctgtggctc 9060 

tccgtcaagc tagaaagatt aagagttttt ttgttgatta gtgaattttt gttttattta 9120 

tgtctgatag ttcaataaag agacaacaca tacaatataa aatcattgtc tttaaatgtt 9180 

aatttagtag agtgtaaagc ctgcattttt tttgtacgca taaacaatga gttcaccccg 9240 

cttctggttt ttaaataatt atgtcaaact agggaaaatt cttttttttc tettegttet 9300 

ttttttggct tgttgtggag tcacaggctt gtcttcagat tgatagaggt tgtatacact 93 60 
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caacagagca atcttggcac gttcgcttcc ttttagatga gctcttgtag gatatgttgt 9420 

cttctgctgc ttgagtacag atccaattgc agcatatact tggcaagcag ctcgtacacc 9480 

gccttgacag tttgccggca acttgtcaat gcccttctta gctctcacca tgatagcgtc 9540 

tgcctttcct acaagcttgg cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta 9600 

tccgctcaca attccacaca acatacgagc cggaagcata aagtgtaaag cctggggtgc 9660 

ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt tccagtcggg 9720 

aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg 9780 

tattgggcca aagacaaaag ggcgacattc aaccgattga gggagggaag gtaaatattg 9840 

acggaaatta ttcattaaag gtgaattatc accgtcaccg acttgagcca tttgggaatt 9900 

agagccagca aaatcaccag tagcaccatt accattagca aggccggaaa cgtcaccaat 9960 

gaaaccatcg atagcagcac cgtaatcagt agcgacagaa tcaagtttgc ctttagcgtc 10020 

agactgtagc gcgttttcat cggcattttc ggtcatagcc cccttattag cgtttgccat 10080 

cttttcataa tcaaaatcac cggaaccaga gccaccaccg gaaccgcctc cctcagagcc 10140 

gccaccctca gaaccgccac cctcagagcc accaccctca gagccgccac cagaaccacc 10200 

accagagccg ccgccagcat tgacaggagg cccgatctag taacatagat gacaccgcgc 10260 

gcgataattt atcctagttt gcgcgctata ttttgttttc tatcgcgtat taaatgtata 10320 

attgcgggac tctaatcata aaaacccatc tcataaataa cgtcatgcat tacatgttaa 10380 

ttattacatg cttaacgtaa ttcaacagaa attatatgat aatcatcgca agaccggcaa 10440 

caggattcaa tcttaagaaa ctttattgcc aaatgtttga acgatcgggg atcatccggg 10500 

tctgtggcgg gaactccacg aaaatatccg aacgcagcaa gatatcgcgg tgcatctcgg 10560 

tcttgcctgg gcagtcgccg ccgacgccgt tgatgtggac gccgggcccg atcatattgt 10620 
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cgctcaggat cgtggcgttg tgcttgtcgg ccgttgctgt cgtaatgata tcggcacctt 10680 

cgaccgcctg ttccgcagag atcccgtggg cgaagaactc cagcatgaga tccccgcgct 10740 

ggaggatcat ccagccggcg tcccggaaaa cgattccgaa gcccaacctt tcatagaagg 10800 

cggcggtgga atcgaaatct cgtgatggca ggttgggcgt cgcttggtcg gtcatttcga 10860 

accccagagt cccgctcaga agaactcgtc aagaaggcga tagaaggcga tgcgctgcga 10920 

atcgggagcg gcgataccgt aaagcacgag gaagcggtca gcccattcgc cgccaagctc 10980 

ttcagcaata tcacgggtag ccaacgctat gtcctgatag cggtccgcca cacccagccg 11040 

gccacagtcg atgaatccag aaaagcggcc attttccacc atgatattcg gcaagcaggc 11100 

atcgccatgg gtcacgacga gatcatcgcc gtcgggcatg cgcgccttga gcctggcgaa 11160 

cagttcggct ggcgcgagcc cctgatgctc ttcgtccaga tcatcctgat cgacaagacc 11220 

ggcttccatc cgagtacgtg ctcgctcgat gcgatgtttc gcttggtggt cgaatgggca 11280 

ggtagccgga tcaagcgtat gcagccgccg cattgcatca gccatgatgg atactttctc 11340 

ggcaggagca aggtgagatg acaggagatc ctgccccggc acttcgccca atagcagcca 11400 

gtcccttccc gcttcagtga caacgtcgag cacagctgcg caaggaacgc ccgtcgtggc 11460 

cagccacgat agccgcgctg cctcgtcctg cagttcattc agggcaccgg acaggtcggt 11520 

cttgacaaaa agaaccgggc gcccctgcgc tgacagccgg aacacggcgg catcagagca 11580 

gccgattgtc tgttgtgccc agtcatagcc gaatagcctc tccacccaag cggccggaga 11640 

acctgcgtgc aatccatctt gttcaatcat gcgaaacgat ccagatccgg tgcagattat 11700 

ttggattgag agtgaatatg agactctaat tggataccga ggggaattta tggaacgtca 11760 

gtggagcatt tttgacaaga aatatttgct agctgatagt gaccttaggc gacttttgaa 11820 
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cgcgcaataa tggtttctga cgtatgtgct tagctcatta aactccagaa acccgcggct 11880 
gagtggctcc ttcaacgttg cggttctgtc agttccaaac gtaaaacggc ttgtcccgcg 11940 
tcatcggcgg gggtcataac gtgactccct taattctccg ctcatgatca gattgtcgtt 12000 
tcccgccttc agtttaaact atcagtgttt gacaggatat attggcgggt aaacctaaga 12 060 
gaaaagagcg tttattagaa taatcggata tttaaaaggg cgtgaaaagg tttatccgtt 12120 
cgtccatttg tatgtgcatg ccaaccacag ggttccccag atctggcgcc ggccagcgag 12180 
acgagcaaga ttggccgccg cccgaaacga tccgacagcg cgcccagcac aggtgcgcag 12240 
gcaaattgca ccaacgcata cagcgccagc agaatgccat agtgggcggt gacgtcgttc 12300 
gagtgaacca gatcgcgcag gaggcccggc agcaccggca taatcaggcc gatgccgaca 12360 
gcgtcgagcg cgacagtgct cagaattacg atcaggggta tgttgggttt cacgtctggc 12420 
ctccggacca gcctccgctg gtccgattga acgcgcggat tctttatcac tgataagttg 12480 
gtggacatat tatgtttatc agtgataaag tgtcaagcat gacaaagttg cagccgaata 12540 
cagtgatccg tgccgccctg gacctgttga acgaggtcgg cgtagacggt ctgacgacac 12600 
gcaaactggc ggaacggttg ggggttcagc agccggcgct ttactggcac ttcaggaaca 12 660 
agcgggcgct gctcgacgca ctggccgaag ccatgctggc ggagaatcat acgcattcgg 12720 
tgccgagagc cgacgacgac tggcgctcat ttctgatcgg gaatgcccgc agcttcaggc 12780 
aggcgctgct cgcctaccgc gatggcgcgc gcatccatgc cggcacgcga ccgggcgcac 12840 
cgcagatgga aacggccgac gcgcagcttc gcttcctctg cgaggcgggt ttttcggccg 12900 
gggacgccgt caatgcgctg atgacaatca gctacttcac tgttggggcc gtgcttgagg 12960 
agcaggccgg cgacagcgat gccggcgagc gcggcggcac cgttgaacag gctccgctct 13020 
cgccgctgtt gcgggccgcg atagacgcct tcgacgaagc cggtccggac gcagcgttcg 13080 
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agcagggact cgcggtgatt gtcgatggat tggcgaaaag gaggctcgtt gtcaggaacg 13140 

ttgaaggacc gagaaagggt gacgattgat caggaccgct gccggagcgc aacccactca 13200 

ctacagcaga gccatgtaga caacatcccc tccccctttc caccgcgtca gacgcccgta 13260 

gcagcccgct acgggctttt tcatgccctg ccctagcgtc caagcctcac ggccgcgctc 13320 

ggcctctctg gcggccttct ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc 13380 

ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 13440 

agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 13500 

ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca 13560 

caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 13620 

gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 13680 

cctgtccgcc tttctccctt cgggaagcgt ggcgcttttc cgctgcataa ccctgcttcg 13740 

gggtcattat agcgattttt tcggtatatc catccttttt cgcacgatat acaggatttt 13800 

gccaaagggt tcgtgtagac tttccttggt gtatccaacg gcgtcagccg ggcaggatag 13860 

gtgaagtagg cccacccgcg agcgggtgtt ccttcttcac tgtcccttat tcgcacctgg 13920 

cggtgctcaa cgggaatcct gctctgcgag gctggccggc taccgccggc gtaacagatg 13980 

agggcaagcg gatggctgat gaaaccaagc caaccaggaa gggcagccca cctatcaagg 14040 

tgtactgcct tccagacgaa cgaagagcga ttgaggaaaa ggcggcggcg gccggcatga 14100 

gcctgtcggc ctacctgctg gccgtcggcc agggctacaa aatcacgggc gtcgtggact 14160 

atgagcacgt ccgcgagctg gcccgcatca atggcgacct gggccgcctg ggcggcctgc 14220 

tgaaactctg gctcaccgac gacccgcgca cggcgcggtt cggtgatgcc acgatcctcg 14280 

ccctgctggc gaagatcgaa gagaagcagg acgagcttgg caaggtcatg atgggcgtgg 14340 
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tccgcccgag ggcagagcca tgactttttt agccgctaaa acggccgggg ggtgcgcgtg 14400 

attgccaagc acgtccccat gcgctccatc aagaagagcg acttcgcgga gctggtgaag 14460 

tacatcaccg acgagcaagg caagaccgag cgcctttgcg acgctcaccg ggctggttgc 14520 

cctcgccgct gggctggcgg ccgtctatgg ccctgcaaac gcgccagaaa cgccgtcgaa 14580 

gccgtgtgcg agacaccgcg gccgccggcg ttgtggatac ctcgcggaaa acttggccct 14640 

cactgacaga tgaggggcgg acgttgacac ttgaggggcc gactcacccg gcgcggcgtt 14700 

gacagatgag gggcaggctc gatttcggcc ggcgacgtgg agctggccag cctcgcaaat 14760 

cggcgaaaac gcctgatttt acgcgagttt cccacagatg atgtggacaa gcctggggat 14820 

aagtgccctg cggtattgac acttgagggg cgcgactact gacagatgag gggcgcgatc 14880 

cttgacactt gaggggcaga gtgctgacag atgaggggcg cacctattga catttgaggg 14940 

gchgtccaca ggcagaaaat ccagcatttg caagggtttc cgcccgtttt tcggccaccg 15000 

ctaacctgtc ttttaacctg cttttaaacc aatatttata aaccttgttt ttaaccaggg 15060 

ctgcgccctg tgcgcgtgac cgcgcacgcc gaaggggggt gccccccctt ctcgaaccct 15120 

cccggcccgc taacgcgggc ctcccatccc cccaggggct gcgcccctcg gccgcgaacg 15180 

gcctcacccc aaaaatggca gcgctggcag tccttgccat tgccgggatc ggggcagtaa 15240 

cgggatgggc gatcagcccg agcgcgacgc ccggaagcat tgacgtgccg caggtgctgg 15300 

catcgacatt cagcgaccag gtgccgggca gtgagggcgg cggcctgggt ggcggcctgc 15360 

ccttcacttc ggccgtcggg gcattcacgg acttcatggc ggggccggca atttttacct 15420 

tgggcattct tggcatagtg gtcgcgggtg ccgtgctcgt gttcgggggt gcgataaacc 15480 

cagcgaacca tttgaggtga taggtaagat tataccgagg tatgaaaacg agaattggac 15540 

ctttacagaa ttactctatg aagcgccata tttaaaaagc taccaagacg aagaggatga 15600 
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agaggatgag gaggcagatt gccttgaata tattgacaat actgataaga taatatatct 15660 

tttatataga agatatcgcc gtatgtaagg atttcagggg gcaaggcata ggcagcgcgc 15720 

ttatcaatat atctatagaa tgggcaaagc ataaaaactt gcatggacta atgcttgaaa 15780 

cccaggacaa taaccttata gcttgtaaat tctatcataa ttgggtaatg actccaactt 15840 

attgatagtg ttttatgttc agataatgcc cgatgacttt gtcatgcagc tccaccgatt 15900 

ttgagaacga cagcgacttc cgtcccagcc gtgccaggtg ctgcctcaga ttcaggttat 15960 

gccgctcaat tcgctgcgta tatcgcttgc tgattacgtg cagctttccc ttcaggcggg 16020 

attcatacag cggccagcca tccgtcatcc atatcaccac gtcaaagggt gacagcaggc 16080 

tcataagacg ccccagcgtc gccatagtgc gttcaccgaa tacgtgcgca acaaccgtct 16140 

tccggagact gtcatacgcg taaaacagcc agcgctggcg cgatttagcc ccgacatagc 16200 

cccactgttc gtccatttcc gcgcagacga tgacgtcact gcccggctgt atgcgcgagg 16260 

ttaccgactg cggcctgagt tttttaagtg acgtaaaatc gtgttgaggc caacgcccat 16320 

aatgcgggct gttgcccggc atccaacgcc attcatggcc atatcaatga ttttctggtg 16380 

cgtaccgggt tgagaagcgg tgtaagtgaa ctgcagttgc catgttttac ggcagtgaga 16440 

gcagagatag cgctgatgtc cggcggtgct tttgccgtta cgcaccaccc cgtcagtagc 16500 

tgaacaggag ggacagctga tagacacaga agccactgga gcacctcaaa aacaccatca 16560 

tacactaaat cagtaagttg gcagcatcac ccataattgt ggtttcaaaa tcggctccgt 16620 

cgatactatg ttatacgcca actttgaaaa caactttgaa aaagctgttt tctggtattt 16680 

aaggttttag aatgcaagga acagtgaatt ggagttcgtc ttgttataat tagcttcttg 16740 

gggtatcttt aaatactgta gaaaagagga aggaaataat aaatggctaa aatgagaata 16800 

tcaccggaat tgaaaaaact gatcgaaaaa taccgctgcg taaaagatac ggaaggaatg 16860 
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tctcctgcta aggtatataa gctggtggga gaaaatgaaa acctatattt aaaaatgacg 16920 

gacagccggt ataaagggac cacctatgat gtggaacggg aaaaggacat gatgctatgg 16980 

ctggaaggaa agctgcctgt tccaaaggtc ctgcactttg aacggcatga tggctggagc 17040 

aatctgctca tgagtgaggc cgatggcgtc ctttgctcgg aagagtatga agatgaacaa 17100 

agccctgaaa agattatcga gctgtatgcg gagtgcatca ggctctttca ctccatcgac 17160 

atatcggatt gtccctatac gaatagctta gacagccgct tagccgaatt ggattactta 17220 

ctgaataacg atctggccga tgtggattgc gaaaactggg aagaagacac tccatttaaa 17280 

gatccgcgcg agctgtatga ttttttaaag acggaaaagc ccgaagagga acttgtcttt 17340 

tcccacggcg acctgggaga cagcaacatc tttgtgaaag atggcaaagt aagtggcttt 17400 

attgatcttg ggagaagcgg cagggcggac aagtggtatg acattgcctt ctgcgtccgg 17460 

tcgatcaggg aggatatcgg ggaagaacag tatgtcgagc tattttttga cttactgggg 17520 

atcaagcctg attgggagaa aataaaatat tatattttac tggatgaatt gttttagtac 17580 

ctagatgtgg cgcaacgatg ccggcgacaa gcaggagcgc accgacttct tccgcatcaa 17640 

gtgttttggc tctcaggccg aggcccacgg caagtatttg ggcaaggggt cgctggtatt 17700 

cgtgcagggc aagattcgga ataccaagta cgagaaggac ggccagacgg tctacgggac 17760 

cgacttcatt gccgataagg tggattatct ggacaccaag gcaccaggcg ggtcaaatca 17820 

ggaataaggg cacattgccc cggcgtgagt cggggcaatc ccgcaaggag ggtgaatgaa 17880 

tcggacgttt gaccggaagg catacaggca agaactgatc gacgcggggt tttccgccga 17940 

ggatgccgaa accatcgcaa gccgcaccgt catgcgtgcg ccccgcgaaa ccttccagtc 18000 

cgtcggctcg atggtccagc aagctacggc caagatcgag cgcgacagcg tgcaactggc 18060 

tccccctgcc ctgcccgcgc catcggccgc cgtggagcgt tcgcgtcgtc tcgaacagga 18120 
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ggcggcaggt ttggcgaagt cgatgaccat cgacacgcga ggaactatga cgaccaagaa 18180 

gcgaaaaacc gccggcgagg acctggcaaa acaggtcagc gaggccaagc aggccgcgtt 18240 

gctgaaacac acgaagcagc agatcaagga aatgcagctt tccttgttcg atattgcgcc 18300 

gtggccggac acgatgcgag cgatgccaaa cgacacggcc cgctctgccc tgttcaccac 18360 

gcgcaacaag aaaatcccgc gcgaggcgct gcaaaacaag gtcattttcc acgtcaacaa 18420 

ggacgtgaag atcacctaca ccggcgtcga gctgcgggcc gacgatgacg aactggtgtg 18480 

gcagcaggtg ttggagtacg cgaagcgcac ccctatcggc gagccgatca ccttcacgtt 18540 

ctacgagctt tgccaggacc tgggctggtc gatcaatggc cggtattaca cgaaggccga 18600 

ggaatgcctg tcgcgcctac aggcgacggc gatgggcttc acgtccgacc gcgttgggca 18660 

cctggaatcg gtgtcgctgc tgcaccgctt ccgcgtcctg gaccgtggca agaaaacgtc 18720 

ccgttgccag gtcctgatcg acgaggaaat cgtcgtgctg tttgctggcg accactacac 18780 

gaaattcata tgggagaagt accgcaagct gtcgccgacg gcccgacgga tgttcgacta 18840 

tttcagctcg caccgggagc cgtacccgct caagctggaa accttccgcc tcatgtgcgg 18900 

atcggattcc acccgcgtga agaagtggcg cgagcaggtc ggcgaagcct gcgaagagtt 18960 

gcgaggcagc ggcctggtgg aacacgcctg ggtcaatgat gacctggtgc attgcaaacg 19020 

ctagggcctt gtggggtcag ttccggctgg gggttcagca gccagcgctt tactggcatt 19080 

tcaggaacaa gcgggcactg ctcgacgcac ttgcttcgct cagtatcgct cgggacgcac 19140 

ggcgcgctct acgaactgcc gataaacaga ggattaaaat tgacaattgt gattaaggct 19200 
cagattcgac ggcttggagc ggccgacgtg caggatttcc gcgagatccg attgtcggcc 19260 
ctgaagaaag ctccagagat gttcgggtcc gtttacgagc acgaggagaa aaagcccatg 19320 
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gaggcgttcg ctgaacggtt gcgagatgcc gtggcattcg gcgcctacat cgacggcgag 19380 

atcattgggc tgtcggtctt caaacaggag gacggcccca aggacgctca caaggcgcat 19440 

ctgtccggcg ttttcgtgga gcccgaacag cgaggccgag gggtcgccgg tatgctgctg 19500 

cgggcgttgc cggcgggttt attgctcgtg atgatcgtcc gacagattcc aacgggaatc 19560 

tggtggatgc gcatcttcat cctcggcgca cttaatattt cgctattctg gagcttgttg 19620 

tttatttcgg tctaccgcct gccgggcggg gtcgcggcga cggtaggcgc tgtgcagccg 19680 

ctgatggtcg tgttcatctc tgccgctctg ctaggtagcc cgatacgatt gatggcggtc 19740 

ctgggggcta tttgcggaac tgcgggcgtg gcgctgttgg tgttgacacc aaacgcagcg 19800 

ctagatcctg tcggcgtcgc agcgggcctg gcgggggcgg tttccatggc gttcggaacc 19860 

gtgctgaccc gcaagtggca acctcccgtg cctctgctca cctttaccgc ctggcaactg 19920 

gcggccggag gacttctgct cgttccagta gctttagtgt ttgatccgcc aatcccgatg 19980 

cctacaggaa ccaatgttct cggcctggcg tggctcggcc tgatcggagc gggtttaacc 20040 

tacttccttt ggttccgggg gatctcgcga ctcgaaccta cagttgtttc cttactgggc 20100 

tttctcagcc ccagatctgg ggtcgatcag ccggggatgc atcaggccga cagtcggaac 20160 

ttcgggtccc cgacctgtac cattcggtga gcaatggata ggggagttga tatcgtcaac 20220 

gttcacttct aaagaaatag cgccactcag cttcctcagc ggctttatcc agcgatttcc 20280 

tattatgtcg gcatagttct caagatcgac agcctgtcac ggttaagcga gaaatgaata 20340 

agaaggctga taattcggat ctctgcgagg gagatgatat ttgatcacag gcagcaacgc 20400 

tctgtcatcg ttacaatcaa catgctaccc tccgcgagat catccgtgtt tcaaacccgg 20460 

cagcttagtt gccgttcttc cgaatagcat cggtaacatg agcaaagtct gccgccttac 20520 

aacggctctc ccgctgacgc cgtcccggac tgatgggctg cctgtatcga gtggtgattt 20580 
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tgtgccgagc tgccggtcgg ggagctgttg gctggctggt ggcaggatat attgtggtgt 20640 

aaacaaattg acgcttagac aacttaataa cacattgcgg acgtttttaa tgtactgggg 20700 

tggtttttct tttcaccagt gagacgggca acagctgatt gcccttcacc gcctggccct 20760 

gagagagttg cagcaagcgg tccacgctgg tttgccccag caggcgaaaa tcctgtttga 20820 

tggtggttcc gaaatcggca aaatccctta taaatcaaaa gaatagcccg agatagggtt 20.880 

gagtgttgtt ccagtttgga acaagagtcc actattaaag aacgtggact ccaacgtcaa 20940 

agggcgaaaa accgtctatc agggcgatgg cccactacgt gaaccatcac ccaaatcaag 21000 

ttttttgggg tcgaggtgcc gtaaagcact aaatcggaac cctaaaggga gcccccgatt 21060 

tagagcttga cggggaaagc cggcgaacgt ggcgagaaag gaagggaaga aagcgaaagg 21120 

agcgggcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc 21180 

tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag 21240 

ggttttccca gtcacgacgt tgtaaaacga cggccagtga attcgagctc ggtacccggg 21300 
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<222> (10472) . . (10472) 
<223> n is a, c, g, or t 

<220> 

<221> misc__feature 
<222> (10563) (10563) 
<223> n is a, c, g, or t 

<400> 47 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 60 

aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 

aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480 

ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540 

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 

cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 660 

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 

atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 7 80 

ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 

ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 

gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 
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ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 

acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 

acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 

agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 

ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 12 60 

ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 

atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 

agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 

agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 

cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 

ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 

gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 

gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 

tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 

ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 

tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 

tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 

ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 

aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 

aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 

ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 
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aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 

taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 

tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 

tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 

catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 

tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 

tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 27 00 

attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 

cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 

ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 

agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 

cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 

tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 

attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 

tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180 

ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 

cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 

gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 

gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 

ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 
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aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 

gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3 600 

gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 

tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720 

agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 3780 

tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 

ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 

tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 

acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 402 0 

tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 

acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 

accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg 4200 

gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 4260 

gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 

ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 

gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 

cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 

tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 

ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 

gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 
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tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 

ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 

gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 

catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 

tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 

cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 

tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 

ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 

cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 

attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 

accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 

ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 

cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 

gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 

agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 

ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 

cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 

tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 5760 

tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 5820 

cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca 5880 

caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 5940 



WO 2004/063358 PCT/EP2004/000100 

252/358 

gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000 

tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 

cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 

tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 

taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 

accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 6300 

aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 6360 

ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 

actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 

cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 

agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 
cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 
tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 
ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 
cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 
gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 
gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 
aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 
aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 
aagaactgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 
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cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 

tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 

tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gtgaaccttt 7380 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 

tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 

gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 

tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 

tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 

gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 

atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 

cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 

ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 79-20 

tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 7980 

cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 

accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 

tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 

acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 

cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 

agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 

gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 

atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 
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gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 

ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 

cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 

tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 

aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 8760 

cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 

tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 

ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 

gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 

tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 

ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 

accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 

ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 

ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 

gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 
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aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 
cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 
ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 
gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 
gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 
tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 
ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 
gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 
cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 10260 
cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt ttcgggagac 10320 
gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 
tccacgcgac tatatatttg tctctaattg tactttgaca tgctcctctt ctttactctg 10440 
atagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgcatgtt 10500 
tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 
canttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 
taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 
atgcacaggt acacttgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 10740 
gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgcaagctt cattttgctt 10800 
tgtaaatttc tggtaactgc caccaagaaa tatgaggata ttcgtgatgt tcctcgtggt 10860 
agccaaaatg atagcacgtg ataaatgacc accaaatagg acggctaatt gtttgggcac 10920 
aatgaggctg aacataaccc cctattggtt cactatgggg taaaaaagta ccaaaataga 10980 
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ataattgtaa tgaacttaaa agcgagggta gcacccaaaa gtaagttaga ttatcacttg 11040 
ggatatggag tatgtattta gcaaagttat aaataatagt caacgcaatt atttgccccc 11100 
aactccagta acctttcata aaatgaaaat accaagcaaa gaaactttgg tgtttaccat 11160 
tgtgaaaatc cgggtctatt gagcttgctg gattgtggtg gtgtaaccaa tgttttttca 11220 
atagtttttg atatggtaaa agaccataaa gggatagggt caatgttcca atcaaatgat 11280 
taatcttggt gttttgggga aatactacgc catgcatggc atcatgagat gtaataaata 11340 
atcccgtata taaaaatgtt tgccatagta taacaggcaa taacatccaa aattttagct 11400 
ttgagatgtc aagggaaagt aataaactca ggctaatgac ccatgcgcta acaatgacaa 11460 
tagcaatgaa aagcccctta aactgagatt tacttctcag tactggagtc agttttgctt 11520 
gatgactgag tggttgttct aactggatca tttctaaaga gaaggtggaa caatgttagc 11580 
ataattgtgc ttgagtgagg actttgaggg taggtacata cttgataaag ttaatgatta 11640 
aagagaaaaa aaaagttttg gttcaaagca gaaattgttt tttaaatcga ttggtgagaa 11700 
aatttttttc tgtttccgca tcaccaaagc cacctcagga atggtcacaa attattggtc 11760 
tgattggacc ataagcatac aaaaagttca ttgaagtata cttagtggct tattagactt 11820 
ttatcgtttt ctaacgcgaa tcagcaatgt ttcttgtttg atttactgct tgctttagat 11880 
catttttgtc tgaaatatta tgcatttgtt caaagcggcc tttgtttcct ttctttcatg 11940 
cttaaacacg ttgtttattc catatattac tttgaatatg catcaccgca aagcggaagt 12000 
gcaaaataac aaagaacctc tttgggttac acgatcaact gctattgtga aaaaaatttc 12060 

tttttgaaaa tttttggaat aatatctctt gcaaaaaaga aatt.ttgtat atttagtagc 12120 
atcaagaaca aatgaaagaa gtgtgggata acaagaatac atcatcttta gacaaaagta 12180 
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cgagaaaaat ctaataagtt gttatagagg tctttgtttt ctttgtgttt atagacagtt 12240 
atttagagtt tgaaaagtgt ctctaatgtg tcttttttta t tat tat tat ttcaaatgtt 12300 
atgtaatata gctaaagcta tagatttgac attttttcta aatataaaat ttcagtcaac 12360 
agaaataaat gacacgagtt ctttttctct ctctcaatcc tgttgatcat caatctttga 12420 
tgtcgtttta aaacaaatga atggcattta gttccttagg tgtcactcac atcttgttga 12480 
ccagaaaatc cttattcgcc ctcaaatctg ctttattcct ttcatttgat ttgatgttta 12540 
agtaatgcaa gcaaacaaaa aagaaacctt tcttgcaaag acaaaagaat tgttttcaga 12600 
ggaaagcaac tcgttgtcat tttttaagga tttagactta taatcgacac catagtttgt 12660 
ccgttacatt ttttattgtc gttttctgat ttccttttaa tctttaagca aaatcaatat 12720 
taacttatct tgtcttccaa taaaaaatgg ataccaataa caataaatcc ttcacaaaga 12780 
aaaaaaaaaa aaactcgaaa aaagcttggc gtaatcatgg tcatagctgt ttcctgtgtg 12840 
aaattgttat ccgctcacaa ttccacacaa catacgagcc ggaagcataa agtgtaaagc 12900 
ctggggtgcc taatgagtga gctaactcac attaattgcg ttgcgctcac tgcccgcttt 12960 
ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg 13020 
cggtttgcgt attgggccaa agacaaaagg gcgacattca accgattgag ggagggaagg 13080 
taaatattga cggaaattat tcattaaagg tgaattatca ccgtcaccga cttgagccat 13140 
ttgggaatta gagccagcaa aatcaccagt agcaccatta ccattagcaa ggccggaaac 13200 
gtcaccaatg aaaccatcga tagcagcacc gtaatcagta gcgacagaat caagtttgcc 13260 
tttagcgtca gactgtagcg cgttttcatc ggcattttcg gtcatagccc ccttattagc 13320 
gtttgccatc ttttcataat caaaatcacc ggaaccagag ccaccaccgg aaccgcctcc 13380 
ctcagagccg ccaccctcag aaccgccacc ctcagagcca ccaccctcag agccgccacc 13440 
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agaaccacca ccagagccgc cgccagcatt gacaggaggc ccgatctagt aacatagatg 13500 
acaccgcgcg cgataattta tcctagtttg cgcgctatat tttgttttct atcgcgtatt 13560 
aaatgtataa ttgcgggact ctaatcataa aaacccatct- cataaataac gtcatgcatt 13620 
acatgttaat tattacatgc ttaacgtaat tcaacagaaa ttatatgata atcatcgcaa 13680 
gaccggcaac aggattcaat cttaagaaac tttattgcca aatgtttgaa cgatcgggga 13740 
tcatccgggt ctgtggcggg aactccacga aaatatccga acgcagcaag atatcgcggt 13800 
gcatctcggt cttgcctggg cagtcgccgc cgacgccgtt gatgtggacg ccgggcccga 13860 
tcatattgtc gctcaggatc gtggcgttgt gcttgtcggc cgttgctgtc gtaatgatat 13920 
cggcaccttc gaccgcctgt tccgcagaga tcccgtgggc gaagaactco agcatgagat 13980 
ccccgcgctg gaggatcatc cagccggcgt cccggaaaac gattccgaag cccaaccttt 14040 
catagaaggc ggcggtggaa tcgaaatctc gtgatggcag gttgggcgtc gcttggtcgg 14100 
tcatttcgaa ccccagagtc ccgctcagaa gaactcgtca agaaggcgat agaaggcgat 14160 
gcgctgcgaa tcgggagcgg cgataccgta aagcacgagg aagcggtcag cccattcgcc 14220 
gccaagctct tcagcaatat cacgggtagc caacgctatg tcctgatagc ggtccgccac 14280 
acccagccgg ccacagtcga tgaatccaga aaagcggcca ttttccacca tgatattcgg 14340 
caagcaggca tcgccatggg tcacgacgag atcatcgccg tcgggcatgc gcgccttgag 14400 
cctggcgaac agttcggctg gcgcgagccc ctgatgctct tcgtccagat catcctgatc 14460 
gacaagaccg gcttccatcc gagtacgtgc tcgctcgatg cgatgtttcg cttggtggtc 14520 
gaatgggcag gtagccggat caagcgtatg cagccgccgc attgcatcag ccatgatgga 14580 
tactttctcg gcaggagcaa ggtgagatga caggagatcc tgccccggca cttcgcccaa 14640 
tagcagccag tcccttcccg cttcagtgac aacgtcgagc acagctgcgc aaggaacgcc 14700 
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cgtcgtggcc agccacgata gccgcgctgc ctcgtcctgc agttcattca gggcaccgga 14760 

caggtcggtc ttgacaaaaa gaaccgggcg cccctgcgct gacagccgga acacggcggc 14820 

atcagagcag ccgattgtct gttgtgccca gtcatagccg aatagcctct ccacccaagc 14880 

ggccggagaa cctgcgtgca atccatcttg ttcaatcatg cgaaacgatc cagatccggt 14940 

gcagattatt tggattgaga gtgaatatga gactctaatt ggataccgag gggaatttat 15000 

ggaacgtcag tggagcattt ttgacaagaa atatttgcta gctgatagtg accttaggcg 15060 

acttttgaac gcgcaataat ggtttctgac gtatgtgctt agctcattaa actccagaaa 15120 

cccgcggctg agtggctcct tcaacgttgc ggttctgtca gttccaaacg taaaacggct 15180 

tgtcccgcgt catcggcggg ggtcataacg tgactccctt aattctccgc tcatgatcag 15240 

attgtcgttt cccgccttca gtttaaacta tcagtgtttg acaggatata ttggcgggta 15300 

aacctaagag aaaagagcgt ttattagaat aatcggatat ttaaaagggc gtgaaaaggt 15360 

ttatccgttc gtccatttgt atgtgcatgc caaccacagg gttccccaga tctggcgccg 15420 

gccagcgaga cgagcaagat tggccgccgc ccgaaacgat ccgacagcgc gcccagcaca 15480 

ggtgcgcagg caaattgcac caacgcatac agcgccagca gaatgccata gtgggcggtg 15540 

acgtcgttcg agtgaaccag atcgcgcagg aggcccggca gcaccggcat aatcaggccg 15600 

atgccgacag cgtcgagcgc gacagtgctc agaattacga tcaggggtat gttgggtttc 15660 

acgtctggcc tccggaccag cctccgctgg tccgattgaa cgcgcggatt ctttatcact 15720 

gataagttgg tggacatatt atgtttatca gtgataaagt gtcaagcatg acaaagttgc 15780 

agccgaatac agtgatccgt gccgccctgg acctgttgaa cgaggtcggc gtagacggtc 15840 

tgacgacacg caaactggcg gaacggttgg gggttcagca gccggcgctt tactggcact 15900 

tcaggaacaa gcgggcgctg ctcgacgcac tggccgaagc catgctggcg gagaatcata 15960 
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cgcattcggt gccgagagcc gacgacgact ggcgctcatt tctgatcggg aatgcccgca 16020 
gcttcaggca ggcgctgctc gcctaccgcg atggcgcgcg catccatgcc ggcacgcgac 16080 
cgggcgcacc gcagatggaa acggccgacg cgcagcttcg cttcctctgc gaggcgggtt 16140 
tttcggccgg ggacgccgtc aatgcgctga tgacaatcag ctacttcact gttggggccg 16200 
tgcttgagga gcaggccggc gacagcgatg ccggcgagcg cggcggcacc gttgaacagg 16260 
ctccgctctc gccgctgttg cgggccgcga tagacgcctt cgacgaagcc ggtccggacg 16320 
cagcgttcga gcagggactc gcggtgattg tcgatggatt ggcgaaaagg aggctcgttg 16380 
tcaggaacgt tgaaggaccg agaaagggtg acgattgatc aggaccgctg ccggagcgca 16440 
acccactcac tacagcagag ccatgtagac aacatcccct ccccctttcc accgcgtcag 16500 
acgcccgtag cagcccgcta cgggcttttt catgccctgc cctagcgtcc aagcctcacg 16560 
gccgcgctcg gcctctctgg cggccttctg gcgctcttcc gcttcctcgc tcactgactc 16620 
gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg 16680 
gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa 16740 
ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga 16800 
cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag 16860 
ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct 16920 
taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgcttttcc gctgcataac 16980 
cctgcttcgg ggtcattata gcgatttttt cggtatatcc atcctttttc gcacgatata 17040 
caggattttg ccaaagggtt cgtgtagact ttccttggtg tatccaacgg cgtcagccgg 17100 
gcaggatagg tgaagtaggc ccacccgcga gcgggtgttc cttcttcact gtcccttatt 17160 
cgcacctggc ggtgctcaac gggaatcctg ctctgcgagg ctggccggct accgccggcg 17220 
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taacagatga gggcaagcgg atggctgatg aaaccaagcc aaccaggaag ggcagcccac 17280 

ctatcaaggt gtactgcctt ccagacgaac gaagagcgat tgaggaaaag gcggcggcgg 17340 

ccggcatgag cctgtcggcc tacctgctgg ccgtcggcca gggctacaaa atcacgggcg 17400 

tcgtggacta tgagcacgtc cgcgagctgg cccgcatcaa tggcgacctg ggccgcctgg 17460 

gcggcctgct gaaactctgg ctcaccgacg acccgcgcac ggcgcggttc ggtgatgcca 17520 

cgatcctcgc cctgctggcg aagatcgaag agaagcagga cgagcttggc aaggtcatga 17580 

tgggcgtggt ccgcccgagg gcagagccat gactttttta gccgctaaaa cggccggggg 17640 

gtgcgcgtga ttgccaagca cgtccccatg cgctccatca agaagagcga cttcgcggag 17700 

ctggtgaagt acatcaccga cgagcaaggc aagaccgagc gcctttgcga cgctca 17756 

<210> 48 

<211> 17118 

<212> DNA 
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<220> 
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<220> 

<221> misc_feature 

<222> (10264) . . (10264) 

<223> n is a, c, g, or t 

<220> 

<221> misc_ feature 

<222> (10472) . . (10472) 

<223> n is a, c, g, or t 



<220> 
<221> 
<222> 



misc_feature 
(10563) . . (10563) 



WO 2004/063358 PCT/EP2004/000100 

262/358 

<223> n is a, c, g, or t 
<400> 48 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 60 

aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 

aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480 

ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540 

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 

cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 660 

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 

atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 

ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 

ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 

gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 

acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 

acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 
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agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 

ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 1260 

ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 

atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 

agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 

agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 

cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 

ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 

gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 

gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 

tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 

ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 

tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 

tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 

ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 

aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 
aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 
ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 
aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 
taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 
tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 
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tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 

catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 

tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 

tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 

attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 

cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2 820 

ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 

agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 

cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 

tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 

attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 

tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180 

ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 

cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 

gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 
gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 
ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 
aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 
gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 
gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 
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tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720 

agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 3780 

tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 

ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 

tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 

acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 

tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 

acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 

accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg 4200 

gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 4260 

gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 

ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 

gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 

cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 

tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 

ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 

gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 

tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 

ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 

gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 

catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 
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tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 

cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 

tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 

ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 

cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 

attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 

accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 

ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 

cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 

gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 

agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 

ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 

cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 

tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 5760 

tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 5820 

cgagaaatga ataagaaggc tgataattcg. gatctctgcg agggagatga tatttgatca 5880 

caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 5940 

gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000 

tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 

cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 

tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 
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taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 

accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 6300 

aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 6360 

ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 

actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 

cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 

agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 

cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 

tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 

ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 

cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 

gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 

gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 

aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 

aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 

aagaactgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 

cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 

tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 

tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gtgaaccttt 7380 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 
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tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 

gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 

tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 

tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 

gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 

atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 

cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 

ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 

tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 7980 

cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 

accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 

tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 

acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 

cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 

agaatatgga get teat cga atcaccggca gtaagcgaag gagaatgtga agecaggggt 8340 

gtatagccgt eggegaaata geatgecatt aacctaggta cagaagtcca attgettccg 8400 

atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 

gegtaagetc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 

ctgctttgcc cggtgtatga aaceggaaag gccgctcagg agctggccag cggcgcagac 8580 

egggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 
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tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 

aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 8760 

cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 

tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 

ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 

gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 

tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 

ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 

accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 

ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 

ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 

gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 

aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 

cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 

ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 
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gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 
gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 
tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 
ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 
gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 
cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 10260 
cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt ttcgggagac 10320 
gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 
tccacgcgac tatatatttg tctctaattg tactttgaca tgctcctctt ctttactctg 10440 
atagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgcatgtt 10500 
tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 
canttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 
taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 
atgcacaggt acacttgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 10740 
gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgcaagctt gagattaaaa 10800 
tagataagga aaagaaagtg aaaagaaatt cggaagcatg gcacattctt ctttttataa 10860 
atacatgcct gactttcttt ttccatcgat atgatatatg catatgatag atatacaagc 10920 
aatcttcttc aaggagtttg aaattttgtc ctccaggagc aaaaaaaagt ttttttttat 10980 
acatgtttgt acacaagaat agttaccaat ttgctttggt cttacgtgct gcaagtttat 11040 
atcgttttca atttctttgt ctttacattt tctttgtcct ttatctttcc tcatttagtc 11100 
tttgggagaa ttaggaaaag ggagcggaaa ggtaagaaat gcttgcgtat tttactaatt 11160 
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cggcaaacat ccaatttggc aaacagcagc ctgtgcaacg ctctcgagat gacagtatct 11220 

ttgattacac tctaaatctc gatgacccga ccaaaaagag cgaacaaaga aataatcttg 11280 

tgcattcgaa tatgatggaa gattttttcc cccttattct aaatgttgac atagcgtgta 11340 

tgttatataa acaaaaagaa attgtacaaa ctttcttttc ttctcttttt attttatctc 11400 

tatgatccag ttagaacaac cactcagtca tcaagcaaaa ctgactccag tactgagaag 11460 

taaatctcag tttaaggggc ttttcattgc tattgtcatt gttagcgcat gggtcattag 11520 

cctgagttta ttactttccc ttgacatctc aaagctaaaa ttttggatgt tattgcctgt 11580 

tatactatgg caaacatttt tatatacggg attatttatt acatctcatg atgccatgca 11640 

tggcgtagta tttccccaaa acaccaagat taatcatttg attggaacat tgaccctatc 11700 

cctttatggt cttttaccat atcaaaaact attgaaaaaa cattggttac accaccacaa 11760 

tccagcaagc tcaatagacc cggattttca caatggtaaa caccaaagtt tctttgcttg 11820 

gtattttcat tttatgaaag gttactggag ttgggggcaa ataattgcgt tgactattat 11880 

ttataacttt gctaaataca tactccatat cccaagtgat aatctaactt acttttgggt 11940 

gctaccctcg cttttaagtt cattacaatt attctatttt ggtacttttt taccccatag 12000 

tgaaccaata gggggttatg ttcagcctca ttgtgcccaa acaattagcc gtcctatttg 12060 

gtggtcattt atcacgtgct atcattttgg ctaccacgag gaacatcacg aatatcctca 12120 

tatttcttgg tggcagttac cagaaattta caaagcaaaa tagaagcttg gcgtaatcat 12180 

ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag 12240 

ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg 12300 

cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 12360 

tcggccaacg cgcggggaga ggcggtttgc gtattgggcc aaagacaaaa gggcgacatt 12420 
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caaccgattg agggagggaa ggtaaatatt gacggaaatt attcattaaa ggtgaattat 12480 
caccgtcacc gacttgagcc atttgggaat tagagccagc aaaatcacca gtagcaccat 12540 
taccattagc aaggccggaa acgtcaccaa tgaaaccatc gatagcagca ccgtaatcag 12 600 
tagcgacaga atcaagtttg cctttagcgt cagactgtag cgcgttttca tcggcatttt 12 660 
cggtcatagc ccccttatta gcgtttgcca tcttttcata atcaaaatca ccggaaccag 12720 
agccaccacc ggaaccgcct ccctcagagc cgccaccctc agaaccgcca ccctcagagc 12780 
caccaccctc agagccgcca ccagaaccac caccagagcc gccgccagca ttgacaggag 12840 
gcccgatcta gtaacataga tgacaccgcg cgcgataatt tatcctagtt tgcgcgctat 12900 
attttgtttt ctatcgcgta ttaaatgtat aattgcggga ctctaatcat aaaaacccat 12960 
ctcataaata acgtcatgca ttacatgtta attattacat gcttaacgta attcaacaga 13020 
aattatatga taatcatcgc aagaccggca acaggattca atcttaagaa actttattgc 13080 
caaatgtttg aacgatcggg gatcatccgg gtctgtggcg ggaactccac gaaaatatcc 13140 
gaacgcagca agatatcgcg gtgcatctcg gtcttgcctg ggcagtcgcc gccgacgccg 13200 
ttgatgtgga cgccgggccc gatcatattg tcgctcagga tcgtggcgtt gtgcttgtcg 13260 
gccgttgctg tcgtaatgat atcggcacct tcgaccgcct gttccgcaga gatcccgtgg 13320 
gcgaagaact ccagcatgag atccccgcgc tggaggatca tccagccggc gtcccggaaa 13380 
acgattccga agcccaacct ttcatagaag gcggcggtgg aatcgaaatc tcgtgatggc 13440 
aggttgggcg tcgcttggtc ggtcatttcg aaccccagag tcccgctcag aagaactcgt 13500 
caagaaggcg atagaaggcg atgcgctgcg aatcgggagc ggcgataccg taaagcacga 13560 
ggaagcggtc agcccattcg ccgccaagct cttcagcaat atcacgggta gccaacgcta 13 620 
tgtcctgata gcggtccgcc acacccagcc ggccacagtc gatgaatcca gaaaagcggc 13680 
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cattttccac catgatattc ggcaagcagg catcgccatg ggtcacgacg agatcatcgc 13740 

cgtcgggcat gcgcgccttg agcctggcga acagttcggc tggcgcgagc ccctgatgct 13800 

cttcgtccag atcatcctga tcgacaagac cggcttccat ccgagtacgt gctcgctcga 13860 

tgcgatgttt cgcttggtgg tcgaatgggc aggtagccgg atcaagcgta tgcagccgcc 13920 

gcattgcatc agccatgatg gatactttct cggcaggagc aaggtgagat gacaggagat 13980 

cctgccccgg cacttcgccc aatagcagcc agtcccttcc cgcttcagtg acaacgtcga 14040 

gcacagctgc gcaaggaacg cccgtcgtgg ccagccacga tagccgcgct gcctcgtcct 14100 

gcagttcatt cagggcaccg gacaggtcgg tcttgacaaa aagaaccggg cgcccctgcg 14160 

ctgacagccg gaacacggcg gcatcagagc agccgattgt ctgttgtgcc cagtcatagc 14220 

cgaatagcct ctccacccaa gcggccggag aacctgcgtg caatccatct tgttcaatca 14280 

tgcgaaacga tccagatccg gtgcagatta tttggattga gagtgaatat gagactctaa 14340 

ttggataccg aggggaattt atggaacgtc agtggagcat ttttgacaag aaatatttgc 14400 

tagctgatag tgaccttagg cgacttttga acgcgcaata atggtttctg acgtatgtgc 14460 

ttagctcatt aaactccaga aacccgcggc tgagtggctc cttcaacgtt gcggttctgt 14520 

cagttccaaa cgtaaaacgg cttgtcccgc gtcatcggcg ggggtcataa cgtgactccc 14580 

ttaattctcc gctcatgatc agattgtcgt ttcccgcctt cagtttaaac tatcagtgtt 14640 

tgacaggata tattggcggg taaacctaag agaaaagagc gtttattaga ataatcggat 14700 

atttaaaagg gcgtgaaaag gtttatccgt tcgtccattt gtatgtgcat gccaaccaca 14760 

gggttcccca' gatctggcgc cggccagcga gacgagcaag attggccgcc gcccgaaacg 14820 

atccgacagc gcgcccagca caggtgcgca ggcaaattgc accaacgcat acagcgccag 14880 

cagaatgcca tagtgggcgg tgacgtcgtt cgagtgaacc agatcgcgca ggaggcccgg 14940 
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cagcaccggc ataatcaggc cgatgccgac agcgtcgagc gcgacagtgc tcagaattac 15000 
gatcaggggt atgttgggtt tcacgtctgg cctccggacc agcctccgct ggtccgattg 15060 
aacgcgcgga ttctttatca ctgataagtt ggtggacata ttatgtttat cagtgataaa 15120 
gtgtcaagca tgacaaagtt gcagccgaat acagtgatcc gtgccgccct ggacctgttg 15180 
aacgaggtcg gcgtagacgg tctgacgaca cgcaaactgg cggaacggtt gggggttcag 15240 
cagccggcgc tttactggca cttcaggaac aagcgggcgc tgctcgacgc actggccgaa 15300 
gccatgctgg cggagaatca tacgcattcg gtgccgagag ccgacgacga ctggcgctca 15360 
tttctgatcg ggaatgcccg cagcttcagg caggcgctgc tcgcctaccg cgatggcgcg 15420 
cgcatccatg ccggcacgcg accgggcgca ccgcagatgg aaacggccga cgcgcagctt 15480 
cgcttcctct gcgaggcggg tttttcggcc ggggacgccg tcaatgcgct gatgacaatc 15540 
agctacttca ctgttggggc cgtgcttgag gagcaggccg gcgacagcga tgccggcgag 15600 
cgcggcggca ccgttgaaca ggctccgctc tcgccgctgt tgcgggccgc gatagacgcc 15660 
ttcgacgaag ccggtccgga cgcagcgttc gagcagggac tcgcggtgat tgtcgatgga 15720 
ttggcgaaaa ggaggctcgt tgtcaggaac gttgaaggac cgagaaaggg tgacgattga 15780 
tcaggaccgc tgccggagcg caacccactc actacagcag agccatgtag acaacatccc 15840 
ctcccccttt ccaccgcgtc agacgcccgt agcagcccgc tacgggcttt ttcatgccct 15900 
gccctagcgt ccaagcctca cggccgcgct . cggcctctct ggcggccttc tggcgctctt 15960 
ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 16020 
ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 16080 
tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 16140 
tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 16200 
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gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 16260 

ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 16320 

tggcgctttt ccgctgcata accctgcttc ggggtcatta tagcgatttt ttcggtatat 16380 

ccatcctttt tcgcacgata tacaggattt tgccaaaggg ttcgtgtaga ctttccttgg 16440 

tgtatccaac ggcgtcagcc gggcaggata ggtgaagtag gcccacccgc gagcgggtgt 16500 

tccttcttca ctgtccctta ttcgcacctg gcggtgctca acgggaatcc tgctctgcga 16560 

ggctggccgg ctaccgccgg cgtaacagat gagggcaagc ggatggctga tgaaaccaag 16620 

ccaaccagga agggcagccc acctatcaag gtgtactgcc ttccagacga acgaagagcg 16680 

attgaggaaa aggcggcggc ggccggcatg agcctgtcgg cctacctgct ggccgtcggc 16740 

cagggctaca aaatcacggg cgtcgtggac tatgagcacg tccgcgagct ggcccgcatc 16800 

aatggcgacc tgggccgcct gggcggcctg ctgaaactct ggctcaccga cgacccgcgc 16860 

acggcgcggt tcggtgatgc cacgatcctc gccctgctgg cgaagatcga agagaagcag 16920 

gacgagcttg gcaaggtcat gatgggcgtg gtccgcccga gggcagagcc atgacttttt 16980 

tagccgctaa aacggccggg gggtgcgcgt gattgccaag cacgtcccca tgcgctccat 17040 

caagaagagc gacttcgcgg agctggtgaa gtacatcacc gacgagcaag gcaagaccga 17100 

gcgcctttgc gacgctca 17118 
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<220> 

<221> misc_feature 
<222> (3471) . . (3471) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (3679) . . (3679) 

<223> n is a, c, g, or t 

<220> 

<221> misc__f eature 

<222> (3770) . . (3770) 

<223> n is a, c, g, or t 

<400> 49 

gatctttcga cactgaaata cgtcgagcct gctccgcttg gaagcggcga ggagcctcgt 60 

cctgtcacaa ctaccaacat ggagtacgat aagggccagt tccgccagct cattaagagc 120 

cagttcatgg gcgttggcat gatggccgtc atgcatctgt acttcaagta caccaacgct 180 

cttctgatcc agtcgatcat ccgctgaagg cgctttcgaa tctggttaag atccacgtct 240 

tcgggaagcc agcgactggt gacctccagc gtccctttaa ggctgccaac agctttctca 300 

gccagggcca gcccaagacc gacaaggcct ccctccagaa cgccgagaag aactggaggg 3 60 

gtggtgtcaa ggaggagtaa gctccttatt gaagtcggag gacggagcgg tgtcaagagg 420 

atattcttcg actctgtatt atagataaga tgatgaggaa ttggaggtag catagcttca 480 

tttggatttg ctttccaggc tgagactcta gcttggagca tagagggtcc tttggctttc 540 

aatattctca agtatctcga gtttgaactt attccctgtg aaccttttat tcaccaatga 600 

gcattggaat gaacatgaat ctgaggactg caatcgccat gaggfctttcg aaatacatcc 660 

ggatgtcgaa ggcttggggc acctgcgttg gttgaattta gaacgtggca ctattgatca 720 
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tccgatagct ctgcaaaggg cgttgcacaa tgcaagtcaa acgttgctag cagttccagg 780 

tggaatgtta tgatgagcat tgtattaaat caggagatat agcatgatct ctagttagct 840 

caccacaaaa gtcagacggc gtaaccaaaa gtcacacaac acaagctgta aggatttcgg 900 

cacggctacg gaagacggag aagccacctt cagtggactc gagtaccatt taattctatt 960 

tgtgtttgat cgagacctaa tacagcccct acaacgacca tcaaagtcgt atagctacca 1020 

gtgaggaagt ggactcaaat cgacttcagc aacatctcct ggataaactt taagcctaaa 1080 

ctatacagaa taagataggt ggagagctta taccgagctc ccaaatctgt ccagatcatg 1140 

gttgaccggt gcctggatct tcctatagaa tcatccttat tcgttgacct agctgattct 1200 

ggagtgaccc agagggtcat gacttgagcc taaaatccgc cgcctccacc atttgtagaa 1260 

aaatgtgacg aactcgtgag ctctgtacag tgaccggtga ctctttctgg catgcggaga 1320 

gacggacgga cgcagagaga agggctgagt aataagccac tggccagaca gctctggcgg 13 80 

ctctgaggtg cagtggatga ttattaatcc gggaccggcc gcccctccgc cccgaagtgg 1440 

aaaggctggt gtgcccctcg ttgaccaaga atctattgca tcatcggaga atatggagct 1500 

tcatcgaatc accggcagta agcgaaggag aatgtgaagc caggggtgta tagccgtcgg 1560 

cgaaatagca tgccattaac ctaggtacag aagtccaatt gcttccgatc tggtaaaaga 1620 

ttcacgagat agtaccttct ccgaagtagg tagagcgagt acccggcgcg taagctccct 1680 

aattggccca tccggcatct gtagggcgtc caaatatcgt gcctctcctg ctttgcccgg 1740 

tgtatgaaac cggaaaggcc gctcaggagc tggccagcgg cgcagaccgg gaacacaagc 1800 
tggcagtcga cccatccggt gctctgcact cgacctgctg aggtccctca gtccctggta 1860 
ggcagctttg ccccgtctgt ccgcccggtg tgtcggcggg gttgacaagg tcgttgcgtc 1920 
agtccaacat ttgttgccat attttcctgc tctccccacc agctgctctt ttcttttctc 1980 
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tttcttttcc catcttcagt atattcatct tcccatccaa gaacctttat ttcccctaag 2040 
taagtacttt gctacatcca tactccatcc ttcccatccc ttattccttt gaacctttca 2100 
gttcgagctt tcccacttca tcgcagcttg actaacagct accccgcttg agcagacatc 2160 
accatgcctg aactcaccgc gacgtctgtc gagaagtttc tgatcgaaaa gttcgacagc 2220 
gtctccgacc tgatgcagct ctcggagggc gaagaatctc gtgctttcag cttcgatgta 2280 
ggagggcgtg gatatgtcct gcgggtaaat agctgcgccg atggtttcta caaagatcgt 2340 
tatgtttatc ggcactttgc atcggccgcg ctcccgattc cggaagtgct tgacattggg 2400 
gaattcagcg agagcctgac ctattgcatc tcccgccgtg cacagggtgt cacgttgcaa 2460 
gacctgcctg aaaccgaact gcccgctgtt ctgcagccgg tcgcggaggc catggatgcg 2520 
atcgctgcgg ccgatcttag ccagacgagc gggttcggcc cattcggacc gcaaggaatc 2580 
ggtcaataca ctacatggcg tgatttcata tgcgcgattg ctgatcccca tgtgtatcac 2640 
tggcaaactg tgatggacga caccgtcagt gcgtccgtcg cgcaggctct cgatgagctg 2700 
atgctttggg ccgaggactg ccccgaagtc cggcacctcg tgcacgcgga tttcggctcc 2760 
aacaatgtcc tgacggacaa tggccgcata acagcggtca ttgactggag cgaggcgatg 2820 
ttcggggatt cccaatacga ggtcgccaac atcttcttct ggaggccgtg gttggcttgt 2880 
atggagcagc agacgcgcta cttcgagcgg aggcatccgg agcttgcagg atcgccgcgg 2940 
ctccgggcgt atatgctccg cattggtctt gaccaactct atcagagctt ggttgacggc 3000 
aatttcgatg atgcagcttg ggcgcagggt cgatgcgacg caatcgtccg atccggagcc 3060 
gggactgtcg ggcgtacaca aatcgcccgc agaagcgcgg ccgtctggac cgatggctgt 3120 
gtagaagtac tcgccgatag tggaaaccga cgccccagca ctcgtccgag ggcaaaggaa 3180 
tagagtagat gccgaccgcg ggatcgatcc acttaacgtt actgaaatca tcaaacagct 3240 
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tgacgaatct ggatataaga tcgttggtgt cgatgtcagc tccggagttg agacaaatgg 3300 

tgttcaggat ctcgataaga tacgttcatt tgtccaagca gcaaagagtg ccttctagtg 3360 

atttaatagc tccatgtcaa caagaataaa acgcgttttc gggtttacct cttccagata 3420 

cagctcatct gcaatgcatt aatgcattga ctgcaaccta gtaacgcctt ncaggctccg 3480 

gcgaagagaa gaatagctta gcagagctat tttcattttc gggagacgag atcaagcaga 3540 

tcaacggtcg tcaagagacc tacgagactg aggaatccgc tcttggctcc acgcgactat 3600 

atatttgtct ctaattgtac tttgacatgc tcctcttctt tactctgata gcttgactat 3660 

gaaaattccg tcaccagcnc ctgggttcgc aaagataatt gcatgtttct tccttgaact 3720 

ctcaagccta caggacacac attcatcgta ggtataaacc tcgaaatcan ttcctactaa 3780 

gatggtatac aatagtaacc atgcatggtt gcctagtgaa tgctccgtaa cacccaatac 3840 

gccggccgaa acttttttac aactctccta tgagtcgttt acccagaatg cacaggtaca 3900 

cttgtttaga ggtaatcctt ctttctagct agaagtcctc gtgtactgtg taagcgccca 3960 

ctccacatct ccactcgacc tgcaggcatg caaagcttga gattaaaata gataaggaaa 4020 

agaaagtgaa aagaaattcg gaagcatggc acattcttct ttttataaat acatgcctga 4080 

ctttcttttt ccatcgatat gatatatgca tatgatagat atacaagcaa tcttcttcaa 4140 

ggagtttgaa attttgtcct ccaggagcaa aaaaaagttt ttttttatac atgtttgtac 4200 

acaagaatag ttaccaattt gctttggtct. tacgtgctgc aagtttatat cgttttcaat 4260 

ttctttgtct ttacattttc tttgtccttt atctttcctc atttagtctt tgggagaatt 4320 

aggaaaaggg agcggaaagg taagaaatgc ttgcgtattt tactaattcg gcaaacatcc 4380 

aatttggcaa acagcagcct gtgcaacgct ctcgagatga cagtatcttt gattacactc 4440 
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taaatctcga tgacccgacc aaaaagagcg aacaaagaaa taatcttgtg cattcgaata 4500 

tgatggaaga ttttttcccc cttattctaa atgttgacat agcgtgtatg ttatataaac 4560 

aaaaagaaat tgtacaaact ttcttttctt ctctttttat tttatctcta tgctgtcgaa 4620 

gctgcagtca atcagcgtca aggcccgccg cgttgaacta gcccgcgaca tcacgcggcc 4680 

caaagtctgc ctgcatgctc agcggtgctc gttagttcgg ctgcgagtgg cagcaccaca 4740 

gacagaggag gcgctgggaa ccgtgcaggc tgccggcgcg ggcgatgagq acagcgccga 4800 

tgtagcactc cagcagcttg accgggctat cgcagagcgt cgtgcccggc gcaaacggga 4860 

gcagctgtca taccaggctg ccgccattgc agcatcaatt ggcgtgtcag gcattgccat 4920 

cttcgccacc tacctgagat ttgccatgca catgaccgtg ggcggcgcag tgccatgggg 4980 

tgaagtggct ggcactctcc tcttggtggt tggtggcgcg ctcggcatgg agatgtatgc 5040 

ccgctatgca cacaaagcca tctggcatga gtcgcctctg ggctggctgc tgcacaagag 5100 

ccaccacaca cctcgcactg gaccctttga agccaacgac ttgtttgcaa tcatcaatgg 5160 

actgcccgcc atgctcctgt gtacctttgg cttctggctg cccaacgtcc tgggggcggc 5220 

ctgctttgga gcggggctgg gcatcacgct atacggcatg gcatatatgt ttgtacacga 5280 
tggcctggtg cacaggcgct ttcccaccgg gcccatcgct ggcctgccct acatgaagcg 5340 
cctgacagtg gcccaccagc tacaccacag cggcaagtac ggtggcgcgc cctggggtat 5400 
gttcttgggt ccacaggagc tgcagcacat tccaggtgcg gcggaggagg tggagcgact 5460 
ggtcctggaa ctggactggt ccaagcgggc gattgtgact gatagcgaga ctctgggtcg 5520 
atgttatctg cctcaacaat ggcttagaaa agaagaaaca gaacaaatac agcaaggcaa 5580 
cgcccgtagc ctaggtgatc aaagactgtt gggcttgtct ctgaagcttg taggaaaggc 5640 
agacgctatc atggtgagag ctaagaaggg cattgacaag ttgccggcaa actgtcaagg 5700 
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cggtgtacga gctgcttgcc aagtatatgc tgcaattgga tctgtactca agcagcagaa 5760 

gacaacatat cctacaagag ctcatctaaa aggaagcgaa cgtgccaaga ttgctctgtt 5820 

gagtgtatac aacctctatc aatctgaaga caagcctgtg gctctccgtc aagctagaaa 5880 

gattaagagt ttttttgttg attagtgaat ttttgtttta tttatgtctg atagttcaat 5940 

aaagagacaa cacatacaat ataaaatcat tgtctttaaa tgttaattta gtagagtgta 6000 

aagcctgcat tttttttgta cgcataaaca atgaattcac cccgcttctg gtttttaaat 6060 

aattatgtca aactagggaa aattcttttt tttctcttcg ttcttttttt ggcttgttgt 6120 

ggagtcacag gcttgtcttc agattgatag aggttgtata cactcaacag agcaatcttg 6180 

gcacgttcgc ttccttttag atgagctctt gtaggatatg ttgtcttctg ctgcttgagt 6240 

acagatccaa ttgcagcata tacttggcaa gcagctcgta caccgccttg acagtttgcc 63 00 

ggcaacttgt caatgccctt cttagctctc accatgatag cgtctgcctt tcctacaagc 6360 

ttcagagaca agcccaacag tctttgatca cctaggctac gggcgttgcc ttgctgtatt 6420 

tgttctgttt cttcttttct aagccattgt tgaggcagat aacatcgacc caacatcctc 6480 

gagccatact acagcataaa aggatacgtt ttctttaaca gaaatttacc cttttgttat 6540 
cagcacatac aaaaaaaaag aaatttaaga tgagtaggac ttccattctc tcaaaaattt 6600 
tattcaatcc ataaatgaat tatttttgga caaaaaagaa agattatgcc tgattttctc 6660 
tatttttttt ttttttacaa ctccaccaat actttctagc ccagcttggc gtaatcatgg 6720 
tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc 6780 
ggaagcataa agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg 6840 
ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc 6900 
ggccaacgcg cggggagagg cggtttgcgt attgggccaa agacaaaagg gcgacattca 6960 
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accgattgag ggagggaagg taaatattga cggaaattat tcattaaagg tgaattatca 7020 

ccgtcaccga cttgagccat ttgggaatta gagccagcaa aatcaccagt agcaccatta 7080 

ccattagcaa ggccggaaac gtcaccaatg aaaccatcga tagcagcacc gtaatcagta 7140 

gcgacagaat caagtttgcc tttagcgtca gactgtagcg cgttttcatc ggcattttcg 7200 

gtcatagccc ccttattagc gtttgccatc ttttcataat caaaatcacc ggaaccagag 7260 

ccaccaccgg aaccgcctcc ctcagagccg ccaccctcag aaccgccacc ctcagagcca 7320 

ccaccctcag agccgccacc agaaccacca ccagagccgc cgccagcatt gacaggaggc 73 80 

ccgatctagt aacatagatg acaccgcgcg cgataattta tcctagttfcg cgcgctatat 7440 

tttgttttct atcgcgtatt aaatgtataa ttgcgggact ctaatcataa aaacccatct 7500 

cataaataac gtcatgcatt acatgttaat tattacatgc ttaacgtaat tcaacagaaa 7560 

ttatatgata atcatcgcaa gaccggcaac aggattcaat cttaagaaac tttattgcca 7620 

aatgtttgaa cgatcgggga tcatccgggt ctgtggcggg aactccacga aaatatccga 7680 

acgcagcaag atatcgcggt gcatctcggt cttgcctggg cagtcgccgc cgacgccgtt 7740 

gatgtggacg ccgggcccga tcatattgtc gctcaggatc gtggcgttgt gcttgtcggc 7800 

cgttgctgtc gtaatgatat cggcaccttc gaccgcctgt tccgcagaga tcccgtgggc 7860 

gaagaactcc agcatgagat ccccgcgctg gaggatcatc cagccggcgt cccggaaaac 7920 

gattccgaag cccaaccttt catagaaggc ggcggtggaa tcgaaatctc gtgatggcag 7980 

gttgggcgtc gcttggtcgg tcatttcgaa ccccagagtc ccgctcagaa gaactcgtca 8040 

agaaggcgat agaaggcgat gcgctgcgaa tcgggagcgg cgataccgta aagcacgagg 8100 

aagcggtcag cccattcgcc gccaagctct tcagcaatat cacgggtagc caacgctatg 8160 

tcctgatagc ggtccgccac acccagccgg ccacagtcga tgaatccaga aaagcggcca 8220 
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ttttccacca tgatattcgg caagcaggca tcgccatggg tcacgacgag atcatcgccg 8280 

tcgggcatgc gcgccttgag cctggcgaac agttcggctg gcgcgagccc ctgatgctct 8340 

tcgtccagat catcctgatc gacaagaccg gcttccatcc gagtacgtgc tcgctcgatg 8400 

cgatgtttcg cttggtggtc gaatgggcag gtagccggat caagcgtatg cagccgccgc 8460 

attgcatcag ccatgatgga tactttctcg gcaggagcaa ggtgagatga caggagatcc 8520 

tgccccggca cttcgcccaa tagcagccag tcccttcccg cttcagtgac aacgtcgagc 8580 

acagctgcgc aaggaacgcc cgtcgtggcc agccacgata gccgcgctgc ctcgtcctgc 8640 

agttcattca gggcaccgga caggtcggtc ttgacaaaaa gaaccgggcg cccctgcgct 8700 

gacagcpgga acacggcggc atcagagcag ccgattgtct gttgtgccca gtcatagccg 8760 

aatagcctct ccacccaagc ggccggagaa cctgcgtgca atccatcttg ttcaatcatg 8820 

cgaaacgatc cagatccggt gcagattatt tggattgaga gtgaatatga gactctaatt 8880 

ggataccgag gggaatttat ggaacgtcag tggagcattt ttgacaagaa atatttgcta 8940 

gctgatagtg accttaggcg acttttgaac gcgcaataat ggtttctgac gtatgtgctt 9000 

agctcattaa actccagaaa cccgcggctg agtggctcct tcaacgttgc ggttctgtca 9060 

gttccaaacg taaaacggct tgtcccgcgt catcggcggg ggtcataacg tgactccctt 9120 

aattctccgc tcatgatcag attgtcgttt cccgccttca gtttaaacta tcagtgtttg 9180 

acaggatata ttggcgggta aacctaagag aaaagagcgt ttattagaat aatcggatat 9240 

ttaaaagggc gtgaaaaggt ttatccgttc gtccatttgt atgtgcatgc caaccacagg 9300 

gttccccaga tctggcgccg gccagcgaga cgagcaagat tggccgccgc ccgaaacgat 9360 

ccgacagcgc gcccagcaca ggtgcgcagg caaattgcac caacgcatac agcgccagca 9420 

gaatgccata gtgggcggtg acgtcgttcg agtgaaccag atcgcgcagg aggcccggca 9480 
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gcaccggcat aatcaggccg atgccgacag cgtcgagcgc gacagtgctc agaattacga 9540 

tcaggggtat gttgggtttc acgtctggcc tccggaccag cctccgctgg tccgattgaa 9600 

cgcgcggatt ctttatcact gataagttgg tggacatatt atgtttatca gtgataaagt 9660 

gtcaagcatg acaaagttgc agccgaatac agtgatccgt gccgccctgg acctgttgaa 9720 

cgaggtcggc gtagacggtc tgacgacacg caaactggcg gaacggttgg gggttcagca- 9780 

gccggcgctt tactggcact tcaggaacaa gcgggcgctg ctcgacgcac tggccgaagc 9840 

catgctggcg gagaatcata cgcattcggt gccgagagcc gacgacgact ggcgctcatt 9900 

tctgatcggg aatgcccgca gcttcaggca ggcgctgctc gcctaccgcg atggcgcgcg 9960 

catccatgcc ggcacgcgac cgggcgcacc gcagatggaa acggccgacg cgcagcttcg 10020 

cttcctctgc gaggcgggtt tttcggccgg ggacgccgtc aatgcgctga tgacaatcag 10080 

ctacttcact gttggggccg tgcttgagga gcaggccggc gacagcgatg ccggcgagcg 10140 

cggcggcacc gttgaacagg ctccgctctc gccgctgttg cgggccgcga tagacgcctt 10200 

cgacgaagcc ggtccggacg cagcgttcga gcagggactc gcggtgattg tcgatggatt 10260 

ggcgaaaagg aggctcgttg tcaggaacgt tgaaggaccg agaaagggtg acgattgatc 10320 

aggaccgctg ccggagcgca acccactcac tacagcagag ccatgtagac aacatcccct 10380 

ccccctttcc accgcgtcag acgcccgtag cagcccgcta cgggcttttt catgccctgc 10440 

cctagcgtcc aagcctcacg gccgcgctcg gcctctctgg cggccttctg gcgctcttcc 10500 

gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 10560 

i- 

cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 10620 

tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 10680 

cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 10740 



WO 2004/063358 PCT/EP2004/000100 

285/358 

aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 10800 

cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 10860 

gcgcttttcc gctgcataac cctgcttcgg ggtcattata gcgatttttt cggtatatcc 10920 

atcctttttc gcacgatata caggattttg ccaaagggtt cgtgtagact ttccttggtg 10980 

tatccaacgg cgtcagccgg gcaggatagg tgaagtaggc ccacccgcga gcgggtgttc 11040 

cttcttcact gtcccttatt cgcacctggc ggtgctcaac gggaatcctg ctctgcgagg 11100 

ctggccggct accgccggcg taacagatga gggcaagcgg atggctgatg aaaccaagcc 11160 

aaccaggaag ggcagcccac ctatcaaggt gtactgcctt ccagacgaac gaagagcgat 11220 

tgaggaaaag gcggcggcgg ccggcatgag cctgtcggcc tacctgctgg ccgtcggcca 11280 

gggctacaaa atcacgggcg tcgtggacta tgagcacgtc cgcgagctgg cccgcatcaa 11340 

tggcgacctg ggccgcctgg gcggcctgct gaaactctgg ctcaccgacg acccgcgcac 11400 

ggcgcggttc ggtgatgcca cgatcctcgc cctgctggcg aagatcgaag agaagcagga 11460 

cgagcttggc aaggtcatga tgggcgtggt ccgcccgagg gcagagccat gactttttta 11520 

gccgctaaaa cggccggggg gtgcgcgtga ttgccaagca cgtccccatg cgctccatca 11580 

agaagagcga cttcgcggag ctggtgaagt acatcaccga cgagcaaggc aagaccgagc 11640 

gcctttgcga cgctcaccgg gctggttgcc ctcgccgctg ggctggcggc cgtctatggc 11700 

cctgcaaacg cgccagaaac gccgtcgaag ccgtgtgcga gacaccgcgg ccgccggcgt 11760 

tgtggatacc tcgcggaaaa cttggccctc actgacagat gaggggcgga cgttgacact 11820 

tgaggggccg actcacccgg cgcggcgttg acagatgagg ggcaggctcg atttcggccg 11880 

gcgacgtgga gctggccagc ctcgcaaatc ggcgaaaacg cctgatttta cgcgagtttc 11940 
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ccacagatga tgtggacaag cctggggata agtgccctgc ggtattgaca cttgaggggc 12000 
gcgactactg acagatgagg ggcgcgatcc ttgacacttg aggggcagag tgctgacaga 12060 
tgaggggcgc acctattgac atttgagggg ctgtccacag gcagaaaatc cagcatttgc 12120 
aagggtttcc gcccgttttt cggccaccgc taacctgtct tttaacctgc ttttaaacca 12180 
atatttataa accttgtttt taaccagggc tgcgccctgt gcgcgtgacc gcgcacgccg 12240 
aaggggggtg cccccccttc tcgaaccctc ccggcccgct aacgcgggcc tcccatcccc 12300 
ccaggggctg cgcccctcgg ccgcgaacgg cctcacccca aaaatggcag cgctggcagt 12360 
ccttgccatt gccgggatcg gggcagtaac gggatgggcg atcagcccga gcgcgacgcc 12420 
cggaagcatt gacgtgccgc aggtgctggc atcgacattc agcgaccagg tgccgggcag 12480 
tgagggcggc ggcctgggtg gcggcctgcc cttcacttcg gccgtcgggg cattcacgga 12540 
cttcatggcg gggccggcaa tttttacctt gggcattctt ggcatagtgg tcgcgggtgc 12600 
cgtgctcgtg ttcgggggtg cgataaaccc agcgaaccat ttgaggtgat aggtaagatt 12660 
ataccgaggt atgaaaacga gaattggacc tttacagaat tactctatga agcgccatat 12720 
ttaaaaagct accaagacga agaggatgaa gaggatgagg aggcagattg ccttgaatat 12780 
attgacaata ctgataagat aatatatctt ttatatagaa gatatcgccg tatgtaagga 12840 
tttcaggggg caaggcatag gcagcgcgct tatcaatata tctatagaat gggcaaagca 12900 
taaaaacttg catggactaa tgcttgaaac ccaggacaat aaccttatag cttgtaaatt 12960 
ctatcataat tgggtaatga ctccaactta ttgatagtgt tttatgttca gataatgccc 13020 
gatgactttg tcatgcagct ccaccgattt tgagaacgac agcgacttcc gtcccagccg 13080 
tgccaggtgc tgcctcagat tcaggttatg ccgctcaatt cgctgcgtat atcgcttgct 13140 
gattacgtgc agctttccct tcaggcggga ttcatacagc ggccagccat ccgtcatcca 13200 



WO 2004/063358 PCT/EP2004/000100 

287/358 

tatcaccacg tcaaagggtg acagcaggct cataagacgc cccagcgtcg ccatagtgcg 13260 
ttcaccgaat acgtgcgcaa caaccgtctt ccggagactg tcatacgcgt aaaacagcca 13320 
gcgctggcgc gatttagccc cgacatagcc ccactgttcg tccatttccg cgcagacgat 13380 
gacgtcactg cccggctgta tgcgcgaggt taccgactgc ggcctgagtt ttttaagtga 13440 
cgtaaaatcg tgttgaggcc aacgcccata atgcgggctg ttgcccggca tccaacgcca 13500 
ttcatggcca tatcaatgat tttctggtgc gtaccgggtt gagaagcggt gtaagtgaac 13560 
tgcagttgcc atgttttacg gcagtgagag cagagatagc gctgatgtcc ggcggtgctt 13620 
ttgccgttac gcaccacccc gtcagtagct gaacaggagg gacagctgat agacacagaa 13680 
gccactggag cacctcaaaa acaccatcat acactaaatc agtaagttgg cagcatcacc 13740 
cataattgtg gtttcaaaat cggctccgtc gatactatgt tatacgccaa ctttgaaaac 13800 
aactttgaaa aagctgtttt ctggtattta aggttttaga atgcaaggaa cagtgaattg 13860 
gagttcgtct tgttataatt agcttcttgg ggtatcttta aatactgtag aaaagaggaa 13920 
ggaaataata aatggctaaa atgagaatat caccggaatt gaaaaaactg atcgaaaaat 13980 
accgctgcgt aaaagatacg gaaggaatgt ctcctgctaa ggtatataag ctggtgggag 14040 
aaaatgaaaa cctatattta aaaatgacgg acagccggta taaagggacc acctatgatg 14100 
tggaacggga aaaggacatg atgctatggc tggaaggaaa gctgcctgtt ccaaaggtcc 14160 
tgcactttga acggcatgat ggctggagca atctgctcat gagtgaggcc gatggcgtcc 14220 
tttgctcgga agagtatgaa gatgaacaaa gccctgaaaa gattatcgag ctgtatgcgg 14280 
agtgcatcag gctctttcac tccatcgaca tatcggattg tccctatacg aatagcttag 14340 
acagccgctt agccgaattg gattacttac tgaataacga tctggccgat gtggattgcg 14400 
aaaactggga agaagacact ccatttaaag atccgcgcga gctgtatgat tttttaaaga 14460 
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cggaaaagcc cgaagaggaa cttgtctttt cccacggcga cctgggagac agcaacatct 14520 

ttgtgaaaga tggcaaagta agtggcttta ttgatcttgg gagaagcggc agggcggaca 14580 

agtggtatga cattgccttc tgcgtccggt cgatcaggga ggatatcggg gaagaacagt 14640 

atgtcgagct attttttgac ttactgggga tcaagcctga ttgggagaaa ataaaatatt 14700 

atattttact ggatgaattg ttttagtacc tagatgtggc gcaacgatgc cggcgacaag 14760 

caggagcgca ccgacttctt ccgcatcaag tgttttggct ctcaggccga ggcccacggc 14820 

aagtatttgg gcaaggggtc gctggtattc gtgcagggca agattcggaa taccaagtac 14880 

gagaaggacg gccagacggt ctacgggacc gacttcattg ccgataaggt ggattatctg 14940 

gacaccaagg caccaggcgg gtcaaatcag gaataagggc acattgcccc ggcgtgagtc 15000 

ggggcaatcc cgcaaggagg gtgaatgaat cggacgtttg accggaaggc atacaggcaa 15060 

gaactgatcg acgcggggtt ttccgccgag gatgccgaaa ccatcgcaag ccgcaccgtc 15120 

atgcgtgcgc cccgcgaaac cttccagtcc gtcggctcga tggtccagca agctacggcc 15180 

aagatcgagc gcgacagcgt gcaactggct ccccctgccc tgcccgcgcc atcggccgcc 15240 

gtggagcgtt cgcgtcgtct cgaacaggag gcggcaggtt tggcgaagtc gatgaccatc 15300 

gacacgcgag gaactatgac gaccaagaag cgaaaaaccg ccggcgagga cctggcaaaa 15360 

caggtcagcg aggccaagca ggccgcgttg ctgaaacaca cgaagcagca gatcaaggaa 15420 

atgcagcttt ccttgttcga tattgcgccg tggccggaca cgatgcgagc gatgccaaac 15480 

gacacggccc gctctgccct gttcaccacg cgcaacaaga aaatcccgcg cgaggcgctg 15540 

caaaacaagg tcattttcca cgtcaacaag gacgtgaaga tcacctacac cggcgtcgag 15600 

ctgcgggccg acgatgacga actggtgtgg cagcaggtgt tggagtacgc gaagcgcacc 15660 

cctatcggcg agccgatcac cttcacgttc tacgagcttt gccaggacct gggctggtcg 15720 
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atcaatggcc ggtattacac gaaggccgag gaatgcctgt cgcgcctaca ggcgacggcg 15780 
atgggcttca cgtccgaccg cgttgggcac ctggaatcgg tgtcgctgct gcaccgcttc 15840 
cgcgtcctgg accgtggcaa gaaaacgtcc cgttgccagg tcctgatcga cgaggaaatc 15900 
gtcgtgctgt ttgctggcga ccactacacg aaattcatat gggagaagta ccgcaagctg 15960 
tcgccgacgg cccgacggat gttcgactat ttcagctcgc accgggagcc gtacccgctc 16020. 
aagctggaaa ccttccgcct catgtgcgga tcggattcca cccgcgtgaa gaagtggcgc 16080 
gagcaggtcg gcgaagcctg cgaagagttg cgaggcagcg gcctggtgga acacgcctgg 16140 
gtcaatgatg acctggtgca ttgcaaacgc tagggccttg tggggtcagt tccggctggg 16200 
ggttcagcag ccagcgcttt actggcattt caggaacaag cgggcactgc tcgacgcact 16260 
tgcttcgctc agtatcgctc gggacgcacg gcgcgctcta cgaactgccg ataaacagag 16320 
gattaaaatt gacaattgtg attaaggctc agattcgacg gcttggagcg gccgacgtgc 16380 
aggatttccg cgagatccga ttgtcggccc tgaagaaagc tccagagatg ttcgggtccg 16440 
tttacgagca cgaggagaaa aagcccatgg aggcgttcgc tgaacggttg cgagatgccg 16500 
tggcattcgg cgcctacatc gacggcgaga tcattgggct gtcggtcttc aaacaggagg 16560 
acggccccaa ggacgctcac aaggcgcatc tgtccggcgt tttcgtggag cccgaacagc 16620 
gaggccgagg ggtcgccggt atgctgctgc gggcgttgcc ggcgggttta ttgctcgtga 16680 
tgatcgtccg acagattcca acgggaatct ggtggatgcg catcttcatc ctcggcgcac 16740 
ttaatatttc gctattctgg agcttgttgt ttatttcggt ctaccgcctg ccgggcgggg 16800 
tcgcggcgac ggtaggcgct gtgcagccgc tgatggtcgt gttcatctct gccgctctgc 16860 
taggtagccc gatacgattg atggcggtcc tgggggctat ttgcggaact gcgggcgtgg 16920 
cgctgttggt gttgacacca aacgcagcgc tagatcctgt cggcgtcgca gcgggcctgg 16980 
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cgggggcggt ttccatggcg ttcggaaccg tgctgacccg caagtggcaa cctcccgtgc 17040 
ctctgctcac ctttaccgcc tggcaactgg cggccggagg acttctgctc gttccagtag 17100 
ctttagtgtt tgatccgcca atcccgatgc ctacaggaac caatgttctc ggcctggcgt 17160 
ggctcggcct gatcggagcg ggtttaacct acttcctttg gttccggggg atctcgcgac 17220 
tcgaacctac agttgtttcc ttactgggct ttctcagccc cagatctggg gtcgatcagc 17280 
cggggatgca tcaggccgac agtcggaact tcgggtcccc gacctgtacc attcggtgag 17340 
caatggatag gggagttgat atcgtcaacg ttcacttcta aagaaatagc gccactcagc 17400 
ttcctcagcg gctttatcca gcgatttcct attatgtcgg catagttctc aagatcgaca 17460 
gcctgtcacg gttaagcgag aaatgaataa gaaggctgat aattcggatc tctgcgaggg 17520 
agatgatatt tgatcacagg cagcaacgct ctgtcatcgt tacaatcaac atgctaccct 17580 
ccgcgagatc atccgtgttt caaacccggc agcttagttg ccgttcttcc gaatagcatc 17640 
ggtaacatga gcaaagtctg ccgccttaca acggctctcc cgctgacgcc gtcccggact 17700 
gatgggctgc ctgtatcgag tggtgatttt gtgccgagct gccggtcggg gagctgttgg 17760 
ctggctggtg gcaggatata ttgtggtgta aacaaattga cgcttagaca acttaataac 17820 
acattgcgga cgtttttaat gtactggggt ggtttttctt ttcaccagtg agacgggcaa 17880 
cagctgattg cccttcaccg cctggccctg agagagttgc agcaagcggt ccacgctggt 17940 
ttgccccagc aggcgaaaat cctgtttgat ggtggttccg aaatcggcaa aatcccttat 18000 
aaatcaaaag aatagcccga gatagggttg agtgttgttc cagtttggaa caagagtcca 18060 
ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc 18120 
ccactacgtg aaccatcacc caaatcaagt tttttggggt cgaggtgccg taaagcacta 18180 
aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg 18240 
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gcgagaaagg aagggaagaa agcgaaagga gcgggcgcca ttcaggctgc gcaactgttg 18300 

ggaagggcga tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc 18360 

tgcaaggcga ttaagttggg taacgccagg gttttcccag tcacgacgtt gtaaaacgac 18420 

ggccagtgaa ttcgagctcg gtacccggg 18449 



<210> 50 

<211> 18617 

<212> DNA 

<213> Artificial 

<220> 

<223> Plasmid 



<220> 

<221> misc_feature 

<222> (10264) . • (10264) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (10472) . . (10472) 

<223> n is a, c, g, or t 



<220> 

<221> misc_ feature 

<222> (10563) . . (10563) 

<223> n is a, c, g, or t 



<400> 50 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 60 

aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 

aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 
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cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480 

ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540 

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 

cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 660 

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 

atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 

ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 

ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 

gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 

acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 

acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 

agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 

ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 1260 

ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 

atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 

agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 

agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 
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cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 

ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 

gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 

gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 

tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 

ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 

tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 

tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 

ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 

aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 

aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 

ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 

aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 

taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 

tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 

tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 

catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 

tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 

tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 

attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 
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cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 

ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 

agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 

cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 

tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 

attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 

tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180 

ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 

cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 

gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 

gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 

ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 

aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 

gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 

gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 

tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720 

agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 3780 

tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 

ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 

tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 
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acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 

tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 

acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 

accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg 4200 

gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 4260 

gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 

ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 

gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 

cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 

tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 

ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 

gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 

tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 

ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 

gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 

catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 

tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 

cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 

tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 

ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 

cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 
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attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 

accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 

"ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 

cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 

gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 

agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 

ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 

cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 

tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 5760 

tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 5820 

cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca 5880 
caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 5940 
gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000 
tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 
cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 
tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 
taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 
accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 6300 
aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 6360 
ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 
actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 



WO 2004/063358 PCT/EP2004/000100 

297/358 

cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 

agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 

cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 

tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 

ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 

cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 

gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 

gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 702 0 

aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 

aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 

aagaactgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 

cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 

tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 

tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gtgaaccttt 7380 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 

tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 

gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 

tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 

tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 

gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 
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atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 

cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 

ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 

tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 7980 

cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 

accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 

tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 

acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 

cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 

agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 

gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 

atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 

gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 

ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 

cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 

tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 

aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 8760 

cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 

tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 
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aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 

ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 

gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 

tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 

ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 

accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 

ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 

ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 

gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 

aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 

cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 

ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 

gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 

gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 

tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 

ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 

gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 

cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 10260 
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cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt ttcgggagac 10320 

gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 

tccacgcgac tatatatttg tctctaattg tactttgaca tgctcctctt ctttactctg 10440 

atagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgcatgtt 10500 

tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 

canttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 

taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 
atgcacaggt acacttgttt agaggtaatc cttcttfccta gctagaagtc ctcgtgtact 10740 
gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgcaagctt gagattaaaa 10800 

tagataagga aaagaaagtg aaaagaaatt cggaagcatg gcacattctt ctttttataa 10860 

atacatgcct gactttcttt ttccatcgat atgatatatg catatgatag atatacaagc 10920 

aatcttcttc aaggagtttg aaattttgtc ctccaggagc aaaaaaaagt ttttttttat 10980 

acatgtttgt acacaagaat agttaccaat ttgctttggt cttacgtgct gcaagtttat 11040 

atcgttttca atttctttgt ctttacattt tctttgtcct ttatctttcc tcatttagtc 11100 

tttgggagaa ttaggaaaag ggagcggaaa ggtaagaaat gcttgcgtat tttactaatt 11160 

cggcaaacat ccaatttggc aaacagcagc ctgtgcaacg ctctcgagat gacagtatct 11220 

ttgattacac tctaaatctc gatgacccga ccaaaaagag cgaacaaaga aataatcttg 11280 

tgcattcgaa tatgatggaa gattttttcc cccttattct aaatgttgac atagcgtgta 11340 

tgttatataa acaaaaagaa attgtacaaa ctttcttttc ttctcttttt attttatctc 11400 
tatgctgtcg aagctgcagt caatcagcgt caaggcccgc cgcgttgaac tagcccgcga 11460 
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catcacgcgg cccaaagtct gcctgcatgc tcagcggtgc tcgttagttc ggctgcgagt 11520 
ggcagcacca cagacagagg aggcgctggg aaccgtgcag gctgccggcg cgggcgatga 11580 
gcacagcgcc gatgtagcac tccagcagct tgaccgggct atcgcagagc gtcgtgcccg 11640 
gcgcaaacgg gagcagctgt cataccaggc tgccgccatt gcagcatcaa ttggcgtgtc 11700 
aggcattgcc atcttcgcca cctacctgag atttgccatg cacatgaccg tgggcggcgc 11760 
agtgccatgg ggtgaagtgg ctggcactct cctcttggtg gttggtggcg cgctcggcat 11820 
ggagatgtat gcccgctatg cacacaaagc catctggcat gagtcgcctc tgggctggct 11880 
gctgcacaag agccaccaca cacctcgcac tggacccttt gaagccaacg acttgtttgc 11940 
aatcatcaat ggactgcccg ccatgctcct gtgtaccttt ggcttctggc tgcccaacgt 12000 
cctgggggcg gcctgctttg gagcggggct gggcatcacg ctatacggca tggcatatat 12060 
gtttgtacac gatggcctgg tgcacaggcg ctttcccacc gggcccatcg ctggcctgcc 12120 
ctacatgaag cgcctgacag tggcccacca gctacaccac agcggcaagt acggtggcgc 12180 
gccctggggt atgttcttgg gtccacagga gctgcagcac attccaggtg cggcggagga 12240 
ggtggagcga ctggtcctgg aactggactg gtccaagcgg tagaagcttg agattaaaat 12300 
agataaggaa aagaaagtga aaagaaattc ggaagcatgg cacattcttc tttttataaa 12360 
tacatgcctg actttctttt tccatcgata tgatatatgc atatgataga tatacaagca 12420 
atcttcttca aggagtttga aattttgtcc tccaggagca aaaaaaagtt tttttttata 12480 
catgtttgta cacaagaata gttaccaatt tgctttggtc ttacgtgctg caagtttata 12540 
tcgttttcaa tttctttgtc tttacatttt ctttgtcctt tatctttcct catttagtct 12600 
ttgggagaat taggaaaagg gagcggaaag gtaagaaatg cttgcgtatt ttactaattc 12660 
ggcaaacatc caatttggca aacagcagcc tgtgcaacgc tctcgagatg acagtatctt 12720 
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tgattacact ctaaatctcg atgacccgac caaaaagagc gaacaaagaa ataatcttgt 12780 
gcattcgaat atgatggaag attttttccc ccttattcta aatgttgaca tagcgtgtat 12840 
gttatataaa caaaaagaaa ttgtacaaac tttcttttct tctcttttta ttttatctct 12900 
atgatccagt tagaacaacc actcagtcat caagcaaaac tgactccagt actgagaagt 12960 
aaatctcagt ttaaggggct tttcattgct attgtcattg ttagcgcatg ggtcattagc 13020 
ctgagtttat tactttccct tgacatctca aagctaaaat tttggatgtt attgcctgtt 13080 
atactatggc aaacattttt atatacggga ttatttatta catctcatga tgccatgcat 13140 
ggcgtagtat ttccccaaaa caccaagatt aatcatttga ttggaacatt gaccctatcc 13200 
ctttatggtc ttttaccata tcaaaaacta ttgaaaaaac attggttaca ccaccacaat 13260 
ccagcaagct caatagaccc ggattttcac aatggtaaac accaaagttt ctttgcttgg 13320 
tattttcatt ttatgaaagg ttactggagt tgggggcaaa taattgcgtt gactattatt 13380 
tataactttg ctaaatacat actccatatc ccaagtgata atctaactta cttttgggtg 13440 
ctaccctcgc ttttaagttc attacaatta ttctattttg gtactttttt accccatagt 13500 
gaaccaatag ggggttatgt tcagcctcat tgtgcccaaa caattagccg tcctatttgg 13560 
tggtcattta tcacgtgcta tcattttggc taccacgagg aacatcacga atatcctcat 13620 
atttcttggt ggcagttacc agaaatttac aaagcaaaat agaagcttgg cgtaatcatg 13 680 
gtcatagctg tttcctgtgt gaaattgtta tccgctcaca attccacaca acatacgagc 13740 
cggaagcata aagtgtaaag cctggggtgc ctaatgagtg agctaactca cattaattgc 13 800 
gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc attaatgaat 13860 
cggccaacgc gcggggagag gcggtttgcg tattgggcca aagacaaaag ggcgacattc 13920 
aaccgattga gggagggaag gtaaatattg acggaaatta ttcattaaag gtgaattatc 13980 
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accgtcaccg acttgagcca tttgggaatt agagccagca aaatcaccag tagcaccatt 14040 

accattagca aggccggaaa cgtcaccaat gaaaccatcg atagcagcac cgtaatcagt 14100 

agcgacagaa tcaagtttgc ctttagcgtc agactgtagc gcgttttcat cggcattttc 14160 

ggtcatagcc cccttattag cgtttgccat cttttcataa tcaaaatcac cggaaccaga 14220 

gccaccaccg gaaccgcctc cctcagagcc gccaccctca gaaccgccac cctcagagcc 14280 

accaccctca gagccgccac cagaaccacc accagagccg ccgccagcat tgacaggagg 14340 

cccgatctag taacatagat gacaccgcgc gcgataattt atcctagttt gcgcgctata 14400 

ttttgttttc tatcgcgtat taaatgtata attgcgggac tctaatcata aaaacccatc 14460 

tcataaataa cgtcatgcat tacatgttaa ttattacatg cttaacgtaa ttcaacagaa 14520 

attatatgat aatcatcgca agaccggcaa caggattcaa tcttaagaaa ctttattgcc 14580 

aaatgtttga acgatcgggg atcatccggg tctgtggcgg gaactccacg aaaatatccg 14640 

aacgcagcaa gatatcgcgg tgcatctcgg tcttgcctgg gcagtcgccg ccgacgccgt 14700 

tgatgtggac gccgggcccg atcatattgt cgctcaggat cgtggcgttg tgcttgtcgg 14760 

ccgttgctgt cgtaatgata tcggcacctt cgaccgcctg ttccgcagag atcccgtggg 14820 

cgaagaactc cagcatgaga tccccgcgct ggaggatcat ccagccggcg tcccggaaaa 14880 

cgattccgaa gcccaacctt tcatagaagg cggcggtgga atcgaaatct cgtgatggca 14940 

ggttgggcgt cgcttggtcg gtcatttcga accccagagt cccgctcaga agaactcgtc 15000 

aagaaggcga tagaaggcga tgcgctgcga atcgggagcg gcgataccgt aaagcacgag 15060 

gaagcggtca gcccattcgc cgccaagctc ttcagcaata tcacgggtag ccaacgctat 15120 

gtcctgatag cggtccgcca cacccagccg gccacagtcg atgaatccag aaaagcggcc 15180 

attttccacc atgatattcg gcaagcaggc atcgccatgg gtcacgacga gatcatcgcc 15240 



WO 2004/063358 PCT/EP2004/000100 

304/358 

gtcgggcatg cgcgccttga gcctggcgaa cagttcggct ggcgcgagcc cctgatgctc 15300 
ttcgtccaga tcatcctgat cgacaagacc ggcttccatc cgagtacgtg ctcgctcgat 15360 
gcgatgtttc gcttggtggt cgaatgggca ggtagccgga tcaagcgtat gcagccgccg 15420 
cattgcatca gccatgatgg atactttctc ggcaggagca aggtgagatg acaggagatc 15480 
ctgccccggc acttcgccca atagcagcca gtcccttccc gcttcagtga caacgtcgag 15540 
cacagctgcg caaggaacgc ccgtcgtggc cagccacgat agccgcgctg cctcgtcctg 15600 
cagttcattc agggcaccgg acaggtcggt cttgacaaaa agaaccgggc gcccctgcgc 15660 
tgacagccgg aacacggcgg catcagagca gccgattgtc tgttgtgccc agtcatagcc 15720 
gaatagcctc tccacccaag cggccggaga acctgcgtgc aatccatctt gttcaatcat 15780 
gcgaaacgat ccagatccgg tgcagattat ttggattgag agtgaatatg agactctaat 15840 
tggataccga ggggaattta tggaacgtca gtggagcatt tttgacaaga aatatttgct 15900 
agctgatagt gaccttaggc gacttttgaa cgcgcaataa tggtttctga cgtatgtgct 15960 
tagctcatta aactccagaa acccgcggct gagtggctcc ttcaacgttg cggttctgtc 16020 
agttccaaac gtaaaacggc ttgtcccgcg tcatcggcgg gggtcataac gtgactccct 16080 
taattctccg ctcatgatca gattgtcgtt tcccgccttc agtttaaact atcagtgttt 16140 
gacaggatat attggcgggt aaacctaaga gaaaagagcg tttattagaa taatcggata 16200 
tttaaaaggg cgtgaaaagg tttatccgtt cgtccatttg tatgtgcatg ccaaccacag 16260 
ggttccccag atctggcgcc ggccagcgag acgagcaaga ttggccgccg cccgaaacga 16320 
tccgacagcg cgcccagcac aggtgcgcag gcaaattgca ccaacgcata cagcgccagc 16380 
agaatgccat agtgggcggt gacgtcgttc gagtgaacca gatcgcgcag gaggcccggc 16440 
agcaccggca taatcaggcc gatgccgaca gcgtcgagcg cgacagtgct cagaattacg 16500 
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atcaggggta tgttgggttt cacgtctggc ctccggacca gcctccgctg gtccgattga 16560 
acgcgcggat tctttatcac tgataagttg gtggacatat tatgtttatc agtgataaag 16620 
tgtcaagcat gacaaagttg cagccgaata cagtgatccg tgccgccctg gacctgttga 16680 
acgaggtcgg cgtagacggt ctgacgacac gcaaactggc ggaacggttg ggggttcagc 16740 
agccggcgct ttactggcac ttcaggaaca agcgggcgct gctcgacgca ctggccgaag 16800 
ccatgctggc ggagaatcat acgcattcgg tgccgagagc cgacgacgac tggcgctcat 16860 
ttctgatcgg gaatgcccgc agcttcaggc aggcgctgct cgcctaccgc gatggcgcgc 16920 
gcatccatgc cggcacgcga ccgggcgcac cgcagatgga aacggccgac gcgcagcttc 16980 
gcttcctctg cgaggcgggt ttttcggccg gggacgccgt caatgcgctg atgacaatca 17040 
gctacttcac tgttggggcc gtgcttgagg agcaggccgg cgacagcgat gccggcgagc 17100 
gcggcggcac cgttgaacag gctccgctct cgccgctgtt gcgggccgcg atagacgcct 17160 
tcgacgaagc cggtccggac gcagcgttcg agcagggact cgcggtgatt gtcgatggat 17220 
tggcgaaaag gaggctcgtt gtcaggaacg ttgaaggacc gagaaagggt gacgattgat 17280 
caggaccgct gccggagcgc aacccactca ctacagcaga gccatgtaga caacatcccc 17340 
tccccctttc caccgcgtca gacgcccgta gcagcccgct acgggctttt tcatgccctg 17400 
ccctagcgtc caagcctcac ggccgcgctc ggcctctctg gcggccttct ggcgctcttc 17460 
cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc 17520 
tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat 17580 
gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt 17640 
ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg 17700 
aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc 17760 



WO 2004/063358 PCT7EP2004/000100 

306/358 

tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt 17820 

ggcgcttttc cgctgcataa ccctgcttcg gggtcattat agcgattttt tcggtatatc 17880 

catccttttt cgcacgatat acaggatttt gccaaagggt tcgtgtagac tttccttggt 17940 

gtatccaacg gcgtcagccg ggcaggatag gtgaagtagg cccacccgcg agcgggtgtt 18000 

ccttcttcac tgtcccttat tcgcacctgg cggtgctcaa cgggaatcct gctctgcgag 18060 

gctggccggc taccgccggc 'gtaacagatg agggcaagcg gatggctgat gaaaccaagc 18120 

caaccaggaa gggcagccca cctatcaagg tgtactgcct tccagacgaa cgaagagcga 18180 

ttgaggaaaa ggcggcggcg gccggcatga gcctgtcggc ctacctgctg gccgtcggcc 18240 

agggctacaa aatcacgggc gtcgtggact atgagcacgt ccgcgagctg gcccgcatca 18300 

atggcgacct gggccgcctg ggcggcctgc tgaaactctg gctcaccgac gacccgcgca 18360 

cggcgcggtt cggtgatgcc acgatcctcg ccctgctggc gaagatcgaa gagaagcagg 18420 

acgagcttgg caaggtcatg atgggcgtgg tccgcccgag ggcagagcca tgactttttt 18480 

agccgctaaa acggccgggg ggtgcgcgtg attgccaagc acgtccccat gcgctccatc 18540 

aagaagagcg acttcgcgga gctggtgaag tacatcaccg acgagcaagg caagaccgag 18600 

cgcctttgcg acgctca 18617 

<210> 51 
<211> 18333 
<212> DNA 
<213> Artificial 

<220> 

<223> Plasmid 
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<220> 

<221> misc_f eature 

<222> (10264) . . (10264) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (10472) . . (10472) 

<223> n is a, c, g, or t 

<220> 

<221> misc_f eature 

<222> (10563) . . (10563) 

<223> n is a, c, g, or t 

<400> 51 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 60 

aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 

aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480 

ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540 

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 

cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 660 

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 



atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 
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ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 

ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 

gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 

acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 

acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 

agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 

ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 1260 

ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 

atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 

agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 

agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 

cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 

ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 

gcaacaaccg tcttccggag actgbcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 

gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 

tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 

ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 

tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 

tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 

ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 
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aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 

aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 

ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 

aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 

taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 

tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 

tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 

catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 

tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 

tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggcfcctt 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 
attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 
cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 282 0 
ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2 880 
agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 
cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 
tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 
attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 
tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180 
ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 
cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 
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gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 

gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 

ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 

aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 

gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 

gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 

tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720 

agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 3780 

tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 

ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 

tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 

acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 402 0 

tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 

acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 

accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg 4200 

gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 4260 

gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 

ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 

gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 

cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 

tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 
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ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 

gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 

tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 

ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 

gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 

catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 

tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 

cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 

tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 

ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 

cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 

attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 

accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 

ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 

cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 

gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 

agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 

ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 

cgacagtcgg aacttcgggt ccccgacctg taccattcgg fcgagcaatgg ataggggagt 5700 

tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 5760 

tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 5820 



WO 2004/063358 PCTYEP2004/000100 

312/358 



cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca 5880 

caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 5940 

gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000 

tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 

cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 

tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 

taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 

accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 6300 

aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 6360 

ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 

actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 

cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 

agaaagcgaa aggagcgggc gecattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 

cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 

tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 

ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 

cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 

gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 

gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 
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aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 
aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 
aagaactgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 
cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 
tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 
tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gtgaaccttt 7380 
tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 
tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 
gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 
tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 
tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 
gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 
atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 
cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 
ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 
tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 7980 
cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 
accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 
tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 
acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 
cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 
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agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 

gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 

atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 

gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 

ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 

cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 

tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 

aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 8760 

cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 

tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 

ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 

gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 

tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 

ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 

accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 

ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 
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ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 

gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 

aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 

cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 

ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 

gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 

gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 

tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 

ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 

gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 

cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 10260 

cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt ttcgggagac 10320 

gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 

tccacgcgac tatatatttg tctctaattg tactttgaca tgctcctctt ctttactctg 10440 

atagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgcatgtt 10500 

tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 

canttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 

taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 

atgcacaggt acacttgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 10740 

gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgcaagctt gagattaaaa 10800 
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tagataagga aaagaaagtg aaaagaaatt cggaagcatg gcacattctt ctttttataa 10860 

atacatgcct gactttcttt ttccatcgat atgatatatg catatgatag atatacaagc 10920 

aatcttcttc aaggagtttg aaattttgtc ctccaggagc aaaaaaaagt ttttttttat 10980 

acatgtttgt acacaagaat agttaccaat ttgctttggt cttacgtgct gcaagtttat 11040 

atcgttttca atttctttgt ctttacattt tctttgtcct ttatctttcc tcatttagtc 11100 

tttgggagaa ttaggaaaag ggagcggaaa ggtaagaaat gcttgcgtat tttactaatt 11160 

cggcaaacat ccaatttggc aaacagcagc ctgtgcaacg ctctcgagat gacagtatct 11220 

ttgattacac tctaaatctc gatgacccga ccaaaaagag cgaacaaaga aataatcttg 11280 

tgcattcgaa tatgatggaa gattttttcc cccttattct aaatgttgac atagcgtgta 11340 

tgttatataa acaaaaagaa attgtacaaa ctttcttttc ttctcttttt attttatctc 11400 

tatgttgtgg atttggaatg ccctgatcgt tttcgttacc gtgattggca tggaagtgat 11460 

tgctgcactg gcacacaaat acatcatgca cggctggggt tggggatggc atctttcaca 11520 

tcatgaaccg cgtaaaggtg cgtttgaagt taacgatctt tatgccgtgg tttttgctgc 11580 

attatcgatc ctgctgattt atctgggcag tacaggaatg tggccgctcc agtggattgg 11640 

cgcaggtatg acggcgtatg gattactcta ttttatggtg cacgacgggc tggtgcatca 117 00 

acgttggcca ttccgctata ttccacgcaa gggctacctc aaacggttgt atatggcgca 117 60 

ccgtatgcat cacgccgtca ggggcaaaga aggttgtgtt tcttttggct tcctctatgc 11820 

gccgcccctg tcaaaacttc aggcgacgct ccgggaaaga catggcgcta gagcgggcgc 11880 

tgccagagat gcgcagggcg gggaggatga gcccgcatcc gggaagtaag ggcctgacca 11940 

gaggcggcca gcagcagcgt taatttttcg ggcgtggtcg ttgactgccg ctgatcccaa 12000 

agcttgagat taaaatagat aaggaaaaga aagtgaaaag aaattcggaa gcatggcaca 12060 
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ttcttctttt tataaataca tgcctgactt tctttttcca tcgatatgat atatgcatat 12120 

gatagatata caagcaatct tcttcaagga gtttgaaatt ttgtcctcca ggagcaaaaa 12180 

aaagtttttt tttatacatg tttgtacaca agaatagtta ccaatttgct ttggtcttac 12240 

gtgctgcaag tttatatcgt tttcaatttc tttgtcttta cattttcttt gtcctttatc 12300 

tttcctcatt tagtctttgg gagaattagg aaaagggagc ggaaaggtaa gaaatgcttg 12360 

cgtattttac taattcggca aacatccaat ttggcaaaca gcagcctgtg caacgctctc 12420 

gagatgacag tatctttgat tacactctaa atctcgatga cccgaccaaa aagagcgaac 12480 

aaagaaataa tcttgtgcat tcgaatatga tggaagattt tttccccctt attctaaatg 12540 

ttgacatagc gtgtatgtta tataaacaaa aagaaattgt acaaactttc ttttcttctc 12600 

tttttatttt atctctatga tccagttaga acaaccactc agtcatcaag caaaactgac 12660 

tccagtactg agaagtaaat ctcagtttaa ggggcttttc attgctattg tcattgttag 12720 

cgcatgggtc attagcctga gtttattact ttcccttgac atctcaaagc taaaattttg 12780 

gatgttattg cctgttatac tatggcaaac atttttatat acgggattat ttattacatc 12840 

tcatgatgcc atgcatggcg tagtatttcc ccaaaacacc aagattaatc atttgattgg 12900 

aacattgacc ctatcccttt atggtctttt accatatcaa aaactattga aaaaacattg 12960 

gttacaccac cacaatccag caagctcaat agacccggat tttcacaatg gtaaacacca 13020 

aagtttcttt gcttggtatt ttcattttat gaaaggttac tggagttggg ggcaaataat . 13080 

tgcgttgact attatttata actttgctaa atacatactc catatcccaa gtgataatct 13140 

aacttacttt tgggtgctac cctcgctttt aagttcatta caattattct attttggtac 13200 

ttttttaccc catagtgaac caataggggg ttatgttcag cctcattgtg cccaaacaat 13260 

tagccgtcct atttggtggt catttatcac gtgctatcat tttggctacc acgaggaaca 13320 
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tcacgaatat cctcatattt cttggtggca gttaccagaa atttacaaag caaaatagaa 133 80 

gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 13440 

cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct 13500 

aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 13560 

agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggccaaaga 13620 

caaaagggcg acattcaacc gattgaggga gggaaggtaa atattgacgg aaattattca 13680 

ttaaaggtga attatcaccg tcaccgactt gagccatttg ggaattagag ccagcaaaat 13740 

caccagtagc accattacca ttagcaaggc cggaaacgtc accaatgaaa ccatcgatag 13800 

cagcaccgta atcagtagcg acagaatcaa gtttgccttt agcgtcagac tgtagcgcgt 13860 

tttcatcggc attttcggtc atagccccct tattagcgtt tgccatcttt tcataatcaa 13920 

aatcaccgga accagagcca ccaccggaac cgcctccctc agagccgcca ccctcagaac 13980 

cgccaccctc agagccacca ccctcagagc cgccaccaga accaccacca gagccgccgc 14040 

cagcattgac aggaggcccg atctagtaac atagatgaca ccgcgcgcga taatttatcc 14100 

tagtttgcgc gctatatttt gttttctatc gcgtattaaa tgtataattg cgggactcta 14160 

atcataaaaa cccatctcat aaataacgtc atgcattaca tgttaattat tacatgctta 14220 

acgtaattca acagaaatta tatgataatc atcgcaagac cggcaacagg attcaatctt 14280 

aagaaacttt attgccaaat gtttgaacga tcggggatca tccgggtctg tggcgggaac 14340 

tccacgaaaa tatccgaacg cagcaagata tcgcggtgca tctcggtctt gcctgggcag 14400 

tcgccgccga cgccgttgat gtggacgccg ggcccgatca tattgtcgct caggatcgtg 14460 

gcgttgtgct tgtcggccgt tgctgtcgta atgatatcgg caccttcgac cgcctgttcc 14520 
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gcagagatcc cgtgggcgaa gaactccagc atgagatccc cgcgctggag gatcatccag 14580 
ccggcgtccc ggaaaacgat tccgaagccc aacctttcat agaaggcggc ggtggaatcg 14640 
aaatctcgtg atggcaggtt gggcgtcgct tggtcggtca tttcgaaccc cagagtcccg 14700 
ctcagaagaa ctcgtcaaga aggcgataga aggcgatgcg ctgcgaatcg ggagcggcga 14760 
taccgtaaag cacgaggaag cggtcagccc attcgccgcc aagctcttca gcaatatcac 14820 
gggtagccaa cgctatgtcc tgatagcggt ccgccacacc cagccggcca cagtcgatga 14880 
atccagaaaa gcggccattt tccaccatga tattcggcaa gcaggcatcg ccatgggtca 14940 
cgacgagatc atcgccgtcg ggcatgcgcg ccttgagcct ggcgaacagt fccggctggcg 15000 
cgagcccctg atgctcttcg tccagatcat cctgatcgac aagaccggct tccatccgag 15060 
tacgtgctcg ctcgatgcga tgtttcgctt ggtggtcgaa tgggcaggta gccggatcaa 15120 
gcgtatgcag ccgccgcatt gcatcagcca tgatggatac tttctcggca ggagcaaggt 15180 
gagatgacag gagatcctgc cccggcactt cgcccaatag cagccagtcc cttcccgctt 15240 
cagtgacaac gtcgagcaca gctgcgcaag gaacgcccgt cgtggccagc cacgatagcc 15300 
gcgctgcctc gtcctgcagt tcattcaggg caccggacag gtcggtcttg acaaaaagaa 15360 
ccgggcgccc ctgcgctgac agccggaaca cggcggcatc agagcagccg attgtctgtt 15420 
gtgcccagtc atagccgaat agcctctcca cccaagcggc cggagaacct gcgtgcaatc 15480 
catcttgttc aatcatgcga aacgatccag atccggtgca gattatttgg attgagagtg 15540 
aatatgagac tctaattgga taccgagggg aatttatgga acgtcagtgg agcatttttg 15600 
acaagaaata tttgctagct gatagtgacc ttaggcgact tttgaacgcg caataatggt 15660 
ttctgacgta tgtgcttagc tcattaaact ccagaaaccc gcggctgagt ggctccttca 15720 
acgttgcggt tctgtcagtt ccaaacgtaa aacggcttgt cccgcgtcat cggcgggggt 15780 
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cataacgtga ctcccttaat tctccgctca tgatcagatt gtcgtttccc gccttcagtt 15840 

taaactatca gtgtttgaca ggatatattg gcgggtaaac ctaagagaaa agagcgttta 15900 

ttagaataat cggatattta aaagggcgtg aaaaggttta tccgttcgtc catttgtatg 15960 

tgcatgccaa ccacagggtt ccccagatct ggcgccggcc agcgagacga gcaagattgg 16020 

ccgccgcccg aaacgatccg acagcgcgcc cagcacaggt gcgcaggcaa attgcaccaa 16080 

cgcatacagc gccagcagaa tgccatagtg ggcggtgacg tcgttcgagt gaaccagatc 16140 

gcgcaggagg cccggcagca ccggcataat caggccgatg ccgacagcgt cgagcgcgac 16200 

agtgctcaga attacgatca ggggtatgtt gggtttcacg tctggcctcc ggaccagcct 16260 

ccgctggtcc gattgaacgc gcggattctt tatcactgat aagttggtgg acatattatg 16320 

tttatcagtg ataaagtgtc aagcatgaca aagttgcagc cgaatacagt gatccgtgcc 163 80 

gccctggacc tgttgaacga ggtcggcgta gacggtctga cgacacgcaa actggcggaa 16440 

cggttggggg ttcagcagcc ggcgctttac tggcacttca ggaacaagcg ggcgctgctc 16500 

gacgcactgg ccgaagccat gctggcggag aatcatacgc attcggtgcc gagagccgac 16560 

gacgactggc gctcatttct gatcgggaat gcccgcagct tcaggcaggc gctgctcgcc 16620 

taccgcgatg gcgcgcgcat ccatgccggc acgcgaccgg gcgcaccgca gatggaaacg 16680 

gccgacgcgc agcttcgctt cctctgcgag gcgggttttt cggccgggga cgccgtcaat 16740 

gcgctgatga caatcagcta cttcactgtt ggggccgtgc ttgaggagca ggccggcgac 16800 

agcgatgccg gcgagcgcgg cggcaccgtt gaacaggctc cgctctcgcc gctgttgcgg 16860 

gccgcgatag acgccttcga cgaagccggt ccggacgcag cgttcgagca gggactcgcg 16920 

gtgattgtcg atggattggc gaaaaggagg ctcgttgtca ggaacgttga aggaccgaga 16980 

aagggtgacg attgatcagg accgctgccg gagcgcaacc cactcactac agcagagcca 17040 
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tgtagacaac atcccctccc cctttccacc gcgtcagacg cccgtagcag cccgctacgg 173-00 

gctttttcat gccctgccct agcgtccaag cctcacggcc gcgctcggcc tctctggcgg 17160 

ccttctggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc 17220 

ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata 17280 

acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg 17340 

cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct 17400 

caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa 17460 

gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc 17520 

tcccttcggg aagcgtggcg cttttccgct gcataaccct gcttcggggt cattatagcg 17580 

attttttcgg tatatccatc ctttttcgca cgatatacag gattttgcca aagggttcgt 17640 

gtagactttc cttggtgbat ccaacggcgt cagccgggca ggataggtga agtaggccca 17700 

cccgcgagcg ggtgttcctt cttcactgtc ccttattcgc acctggcggt gctcaacggg 17760 

aatcctgctc tgcgaggctg gccggctacc gccggcgtaa cagatgaggg caagcggatg 17820 

gctgatgaaa ccaagccaac caggaagggc agcccaccta tcaaggtgta ctgccttcca 17880 

gacgaacgaa gagcgattga ggaaaaggcg gcggcggccg gcatgagcct gtcggcctac 17940 

ctgctggccg tcggccaggg ctacaaaatc acgggcgtcg tggactatga gcacgtccgc 18000 

gagctggccc gcatcaatgg cgacctgggc cgcctgggcg gcctgctgaa actctggctc 18060 

accgacgacc cgcgcacggc gcggttcggt gatgccacga tcctcgccct gctggcgaag 18120 

atcgaagaga agcaggacga gcttggcaag gtcatgatgg gcgtggtccg cccgagggca 18180 

gagccatgac ttttttagcc gctaaaacgg ccggggggtg cgcgtgattg ccaagcacgt 18240 

ccccatgcgc tccatcaaga agagcgactt cgcggagctg gtgaagtaca tcaccgacga 18300 
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gcaaggcaag accgagcgcc tttgcgacgc tea 18333 
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<223> n is a, c, g, or t 

<400> 53 
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<220> 

<223> Primer 

<400> 54 

aagtgacacc ggttacacgc ttgtctt 



<210> 55 

<211> 27 

<212> DNA 

<213> Artificial 



<220> 

<223> Primer 
<400> 55 

gcttatcacc atctgttacc tccttgc 
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<220> 

<223> Primer 
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<210> 57 

<211> 32 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 
<400> 57 

agagagggat ccatgtctga tcaaaagaag ca 

<210> 58 

<211> 37 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 
<400> 58 

actttattgg atccttaaat gcgaatatcg ttgctgc 



<210> 59 
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<220> 

<223> Primer 

<400> 59 

gttccaattg gccacatgaa gagtaagaca ggaaacag 

<210> 60 

<211> 38 

<212> DNA 
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WO 2004/063358 



325/358 



PCT/EP2004/000100 



<220> 

<223> Primer 
<400> 60 

cctgtcttac tcttcatgtg gccaattgga accaacac 
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<211> 38 
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<220> 

<223> Primer 

<400> 61 

ctattttaat catatgtctg atcaaaagaa gcatattg 
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<223> n is a, c, g, or t 
<400> 62 

gatctttcga cactgaaata cgtcgagcct gctccgcttg gaagcggcga ggagcctcgt 60 

cctgtcacaa ctaccaacat ggagtacgat aagggccagt tccgccagct cattaagagc 120 

cagttcatgg gcgttggcat gatggccgtc atgcatctgt acttcaagta caccaacgct 180 

cttctgatcc agtcgatcat ccgctgaagg cgctttcgaa tctggttaag atccacgtct 240 

tcgggaagcc agcgactggt gacctccagc gtccctttaa ggctgccaac agctttctca 300 

gccagggcca gcccaagacc gacaaggcct ccctccagaa cgccgagaag aactggaggg 3 60 

gtggtgtcaa ggaggagtaa gctccttatt gaagtcggag gacggagcgg tgtcaagagg 420 

atattcttcg actctgtatt atagataaga tgatgaggaa ttggaggtag catagcttca 480 

tttggatttg ctttccaggc tgagactcta gcttggagca tagagggtcc tttggctttc 540 

aatattctca agtatctcga gtttgaactt attccctgtg aaccttttat tcaccaatga 600 

gcattggaat gaacatgaat ctgaggactg caatcgccat gaggttttcg aaatacatcc 660 

ggatgtcgaa ggcttggggc acctgcgttg gttgaattta gaacgtggca ctattgatca 720 

tccgatagct ctgcaaaggg cgttgcacaa tgcaagtcaa acgttgctag cagttccagg 780 

tggaatgtta tgatgagcat tgtattaaat caggagatat agcatgatct ctagttagct 840 

caccacaaaa gtcagacggc gtaaccaaaa gtcacacaac acaagctgta aggatttcgg 900 

cacggctacg gaagacggag aagccacctt cagtggactc gagtaccatt taattctatt 960 

tgtgtttgat cgagacctaa tacagcccct acaacgacca tcaaagtcgt atagctacca 1020 

gtgaggaagt ggactcaaat cgacttcagc aacatctcct ggataaactt taagcctaaa 1080 

ctatacagaa taagataggt ggagagctta taccgagctc ccaaatctgt ccagatcatg 1140 

gttgaccggt gcctggatct tcctatagaa tcatccttat tcgttgacct agctgattct 1200 
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ggagtgaccc agagggtcat gacttgagcc taaaatccgc cgcctccacc atttgtagaa 1260 

aaatgtgacg aactcgtgag ctctgtacag tgaccggtga ctctttctgg catgcggaga 1320 

gacggacgga cgcagagaga agggctgagt aataagccac tggccagaca gctctggcgg 1380 

ctctgaggtg cagtggatga ttattaatcc gggaccggcc gcccctccgc cccgaagtgg 1440 

aaaggctggt gtgcccctcg ttgaccaaga atctattgca tcatcggaga atatggagct 1500 

tcatcgaatc accggcagta agcgaaggag aatgtgaagc caggggtgta tagccgtcgg 1560 

cgaaatagca tgccattaac ctaggtacag aagtccaatt gcttccgatc tggtaaaaga 1620 

ttcacgagat agtaccttct ccgaagtagg tagagcgagt acccggcgcg taagctccct 1680 

aattggccca tccggcatct gtagggcgtc caaatatcgt gcctctcctg ctttgcccgg 1740 

tgtatgaaac cggaaaggcc gctcaggagc tggccagcgg cgcagaccgg gaacacaagc 1800 

tggcagtcga cccatccggt gctctgcact cgacctgctg aggtccctca gtccctggta 1860 

ggcagctttg ccccgtctgt ccgcccggtg tgtcggcggg gttgacaagg tcgttgcgtc 1920 

agtccaacat ttgttgccat attttcctgc tctccccacc agctgctctt ttcttttctc 1980 

tttcttttcc catcttcagt atattcatct tcccatccaa gaacctttat ttcccctaag 2040 

taagtacttt gctacatcca tactccatcc ttcccatccc ttattccttt gaacctttca 2100 

gttcgagctt tcccacttca tcgcagcttg actaacagct accccgcttg agcagacatc 2160 

accatgcctg aactcaccgc gacgtctgtc gagaagtttc tgatcgaaaa gttcgacagc 2220 

gtctccgacc tgatgcagct ctcggagggc gaagaatctc gtgctttcag cttcgatgta 2280 

ggagggcgtg gatatgtcct gcgggtaaat agctgcgccg atggtttcta caaagatcgt 2340 

tatgtttatc ggcactttgc atcggccgcg ctcccgattc cggaagtgct tgacattggg 2400 

gaattcagcg agagcctgac ctattgcatc tcccgccgtg cacagggtgt cacgttgcaa 2460 
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gacctgcctg aaaccgaact gcccgctgtt ctgcagccgg tcgcggaggc catggatgcg 2520 

atcgctgcgg ccgatcttag ccagacgagc gggttcggcc cattcggacc gcaaggaatc 2580 

ggtcaataca ctacatggcg tgatttcata tgcgcgattg ctgatcccca tgtgtatcac 2640 

tggcaaactg tgatggacga caccgtcagt gcgtccgtcg cgcaggctct cgatgagctg 2700 

atgctttggg ccgaggactg ccccgaagtc cggcacctcg tgcacgcgga tttcggctcc 2760 

aacaatgtcc tgacggacaa tggccgcata acagcggtca ttgactggag cgaggcgatg 2820 * 

ttcggggatt cccaatacga ggtcgccaac atcttcttct ggaggccgtg gttggcttgt 2880 

atggagcagc agacgcgcta cttcgagcgg aggcatccgg agcttgcagg atcgccgcgg 2940 

ctccgggcgt atatgctccg cattggtctt gaccaactct atcagagctt ggttgacggc 3 000 

aatttcgatg atgcagcttg ggcgcagggt cgatgcgacg caatcgtccg atccggagcc 3060 

gggactgtcg ggcgtacaca aatcgcccgc agaagcgcgg ccgtctggac cgatggctgt 3120 

gtagaagtac tcgccgatag tggaaaccga cgccccagca ctcgtccgag ggcaaaggaa 3180 

tagagtagat gccgaccgcg ggatcgatcc acttaacgtt actgaaatca tcaaacagct 3240 

tgacgaatct ggatataaga tcgttggtgt cgatgtcagc tccggagttg agacaaatgg 3300 

tgttcaggat ctcgataaga tacgttcatt tgtccaagca gcaaagagtg ccttctagtg 3360 

atttaatagc tccatgtcaa caagaataaa acgcgttttc gggtttacct cttccagata 3420 

cagctcatct gcaatgcatt aatgcattga ctgcaaccta gtaacgcctt ncaggctccg 3480 

gcgaagagaa gaatagctta gcagagctat tttcattttc gggagacgag atcaagcaga 3540 

tcaacggtcg tcaagagacc tacgagactg aggaatccgc tcttggctcc acgcgactat 3600 

atatttgtct ctaattgtac tttgacatgc tcctcttctt tactctgata gcttgactat 3 660 

gaaaattccg tcaccagcnc ctgggttcgc aaagataatt gcatgtttct tccttgaact 3720 
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ctcaagccta caggacacac attcatcgta ggtataaacc tcgaaatcan ttcctactaa 3780 

gatggtatac aatagtaacc atgcatggtt gcctagtgaa tgctccgtaa cacccaatac 3840 

gccggccgaa acttttttac aactctccta tgagtcgttt acccagaatg cacaggtaca 3900 

cthgtttaga ggtaatcctt ctttctagct agaagtcctc gtgtactgtg taagcgccca 3960 

ctccacatct ccactcgacc tgcaggcatg caagcttgag tctatcgcct ccaaaaagta 4020 

cggtgctgaa ttcagatatc aatcgcctgt tgctaaaatt aacactgtcg ataaagacaa 4080 

gcgtgtaacc ggtgtcactt tggaaagcgg agaagtcatt gaagccgatg cagtcgtatg 4140 

taatgcggat cttgtttatg cttatcacca tctgttacct ccttgcaatt ggacaaagaa 4200 

gacattagcc tcaaagaaac tcacttcatc atctatttcg ttttattggt ccatgtcaac 4260 

aaaggtgcct caattagacg tacacaatat cttcttggct gaagcctaca aggaaagttt 4320 

tgatgagatt ttcaacgact tcggtttgcc ctctgaagct tggcgtaatc atggtcatag 4380 

ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc 4440 

ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc 4500 

tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa 4560 

cgcgcgggga gaggcggttt gcgtattggg ccaaagacaa aagggcgaca ttcaaccgat 4620 

tgagggaggg aaggtaaata ttgacggaaa ttattcatta aaggtgaatt atcaccgtca 4680 

ccgacttgag ccatttggga afctagagcca gcaaaatcac cagtagcacc attaccatta 4740 

gcaaggccgg aaacgtcacc aatgaaacca tcgatagcag caccgtaatc agtagcgaca 4800 

gaatcaagtt tgcctttagc gtcagactgt agcgcgtttt catcggcatt ttcggtcata 4860 

gcccccttat tagcgtttgc catcttttca taatcaaaat caccggaacc agagccacca 4920 

ccggaaccgc ctccctcaga gccgccaccc tcagaaccgc caccctcaga gccaccaccc 4980 
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tcagagccgc caccagaacc accaccagag ccgccgccag cattgacagg aggcccgatc 5040 

tagtaacata gatgacaccg cgcgcgataa tttatcctag tttgcgcgct atattttgtt 5100 

ttctatcgcg tattaaatgt ataattgcgg gactctaatc ataaaaaccc atctcataaa 5160 

taacgtcatg cattacatgt taattattac atgcttaacg taattcaaca gaaattatat 5220 

gataatcatc gcaagaccgg caacaggatt caatcttaag aaactttatt gccaaatgtt 5280 

tgaacgatcg gggatcatcc gggtctgtgg cgggaactcc acgaaaatat ccgaacgcag 5340 

caagatatcg cggtgcatct cggtcttgec tgggcagtcg ccgccgacgc cgttgatgtg 5400 

gacgccgggc ccgatcatat tgtcgctcag gatcgtggcg ttgtgcttgt cggccgttgc 5460 

tgtcgtaatg atatcggcac cttcgaccgc ctgttccgca gagatcccgt gggcgaagaa 5520 

ctccagcatg agatccccgc gctggaggat catccagccg gcgtcccgga aaacgattcc 5580 

gaagcccaac ctttcataga aggcggcggt ggaatcgaaa tctcgtgatg gcaggttggg 5640 

cgtcgcttgg tcggtcattt cgaaccccag agtcccgctc agaagaactc gtcaagaagg 5700 

cgatagaagg cgatgcgctg cgaatcggga gcggcgatac cgtaaagcac gaggaagcgg 5760 

tcagcccatt cgccgccaag ctcttcagca atatcacggg tagccaacgc tatgtcctga 5820 

tagcggtccg ccacacccag ccggccacag tcgatgaatc cagaaaagcg gccattttcc 5880 

accatgatat tcggcaagca ggcatcgcca tgggtcacga cgagatcatc gccgtcgggc 5940 

atgcgcgcct tgagcctggc gaacagttcg gctggcgcga gcccctgatg ctcttcgtcc 6000 

agatcatcct gatcgacaag accggcttcc atccgagtac gtgctcgctc gatgcgatgt 6060 

ttcgcttggt ggtcgaatgg gcaggtagcc ggatcaagcg tatgcagccg ccgcattgca 6120 

tcagccatga tggatacttt ctcggcagga gcaaggtgag atgacaggag atcctgcccc 6180 

ggcacttcgc ccaatagcag ccagtccctt cccgcttcag tgacaacgtc gagcacagct 6240 
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gcgcaaggaa cgcccgtcgt ggccagccac gatagccgcg ctgcctcgtc ctgcagttca 6300 

ttcagggcac cggacaggtc ggtcttgaca aaaagaaccg ggcgcccctg cgctgacagc 6360 

cggaacacgg cggcatcaga gcagccgatt gtctgttgtg cccagtcata gccgaatagc 6420 

ctctccaccc aagcggccgg agaacctgcg tgcaatccat cttgttcaat catgcgaaac 6480 

gatccagatc cggtgcagat tatttggatt gagagtgaat atgagactct aattggatac 6540 

cgaggggaat ttatggaacg tcagtggagc atttttgaca agaaatattt gctagctgat 6600 

agtgacctta ggcgactttt gaacgcgcaa taatggtttc tgacgtatgt gcttagctca 6660 

ttaaactcca gaaacccgcg gctgagtggc tccttcaacg ttgcggttct gtcagttcca 6720 

aacgtaaaac ggcttgtccc gcgtcatcgg cgggggtcat aacgtgactc ccttaattct 6780 

ccgctcatga tcagattgtc gtttcccgcc ttcagtttaa actatcagtg tttgacagga 6840 

tatattggcg ggtaaaccta agagaaaaga gcgtttatta gaataatcgg atatttaaaa 6900 

gggcgtgaaa aggtttatcc gttcgtccat ttgtatgtgc atgccaacca cagggttccc 6960 

cagatctggc gccggccagc gagacgagca agattggccg ccgcccgaaa cgatccgaca 7020 

gcgcgcccag cacaggtgcg caggcaaatt gcaccaacgc atacagcgcc agcagaatgc 7080 

catagtgggc ggtgacgtcg ttcgagtgaa ccagatcgcg caggaggccc ggcagcaccg 7140 

gcataatcag gccgatgccg acagcgtcga gcgcgacagt gctcagaatt acgatcaggg 7200 

gtatgttggg tttcacgtct ggcctccgga ccagcctccg ctggtccgat tgaacgcgcg 7260 

. gattctttat cactgataag ttggtggaca tattatgttt atcagtgata aagtgtcaag 7320 

catgacaaag ttgcagccga atacagtgat ccgtgccgcc ctggacctgt tgaacgaggt 7380 

cggcgtagac ggtctgacga cacgcaaact ggcggaacgg ttgggggttc agcagccggc 7440 

gctttactgg cacttcagga acaagcgggc gctgctcgac gcactggccg aagccatgct 7500 
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ggcggagaat catacgcatt cggtgccgag agccgacgac gactggcgct catttctgat 7560 
cgggaatgcc cgcagcttca ggcaggcgct gctcgcctac cgcgatggcg cgcgcatcca .7620 

tgccggcacg cgaccgggcg caccgcagat ggaaacggcc gacgcgcagc ttcgcttcct 7680 

ctgcgaggcg ggtttttcgg ccggggacgc cgtcaatgcg ctgatgacaa tcagctactt 7740 

cactgttggg gccgtgcttg aggagcaggc cggcgacagc gatgccggcg agcgcggcgg 7800 

caccgttgaa caggctccgc tctcgccgct gttgcgggcc gcgatagacg ccttcgacga 7860 

agccggtccg gacgcagcgt tcgagcaggg actcgcggtg attgtcgatg gattggcgaa 7920 

aaggaggctc gttgtcagga acgttgaagg accgagaaag ggtgacgatt gatcaggacc 7980 

gctgccggag cgcaacccac tcactacagc agagccatgt agacaacatc ccctccccct 8040 

ttccaccgcg tcagacgccc gtagcagccc gctacgggct ttttcatgcc ctgccctagc 8100 

gtccaagcct cacggccgcg ctcggcctct ctggcggcct tctggcgctc ttccgcttcp 8160 

tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca 8220 

aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca 8280 

aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg 8340 

ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 8400 

acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt 8460 

ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 8520 

ttccgctgca taaccctgct tcggggtcat tatagcgatt ttttcggtat atccatcctt 8580 

tttcgcacga tatacaggat tttgccaaag ggttcgtgta gactttcctt ggtgtatcca 8640 

acggcgtcag ccgggcagga taggtgaagt aggcccaccc gcgagcgggt gttccttctt 8700 

cactgtccct tattcgcacc tggcggtgct caacgggaat cctgctctgc gaggctggcc 8760 
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ggctaccgcc ggcgtaacag atgagggcaa gcggatggct gatgaaacca agccaaccag 8820 

gaagggcagc ccacctatca aggtgtactg ccttccagac gaacgaagag cgattgagga 8880 

aaaggcggcg gcggccggca tgagcctgtc ggcctacctg ctggccgtcg gccagggcta 8940 

caaaatcacg ggcgtcgtgg actatgagca cgtccgcgag ctggcccgca tcaatggcga 9000 

cctgggccgc ctgggcggcc tgctgaaact ctggctcacc gacgacccgc gcacggcgcg 9060 

gttcggtgat gccacgatcc tcgccctgct ggcgaagatc gaagagaagc aggacgagct 9120 

tggcaaggtc atgatgggcg tggtccgccc gagggcagag ccatgacttt tttagccgct 9180 

aaaacggccg gggggtgcgc gtgattgcca agcacgtccc catgcgctcc atcaagaaga 9240 

gcgacttcgc ggagctggtg aagtacatca ccgacgagca aggcaagacc gagcgccttt 9300 

gcgacgctca ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca 93 60 

aacgcgccag aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga 9420 

tacctcgcgg aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg 9480 

gccgactcac ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg 9540 

tggagctggc cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag 9600 
atgatgtgga caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact 9660 
actgacagat gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg 9720 
gcgcacctat tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt 9780 
ttccgcccgt ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt 9840 
ataaaccttg tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg 9900 
ggtgcccccc cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg 9960 

gctgcgcccc tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc 10020 
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cattgccggg atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag 10080 

cattgacgtg ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg 10140 

cggcggcctg ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat 10200 

ggcggggccg gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct 10260 

cgtgttcggg ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg 10320 

aggtatgaaa acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa 10380 

agctaccaag acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac 10440 

aatactgata agataatata tcttttatat agaagatatc gccgtatgta aggatttcag 10500 

ggggcaaggc ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa 10560 

cttgcatgga ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca 10620 

taattgggta atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac 10680 

tttgtcatgc agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag 10740 

gtgctgcctc agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac 10800 

gtgcagcttt cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac 10860 

cacgtcaaag ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc 10920 

gaatacgtgc gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg 10980 

gcgcgattta gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc 11040 

actgcccggc tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa 11100 

atcgtgttga ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg 11160 

gccatatcaa tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt 11220 

tgccatgttt tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg 11280 
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ttacgcacca ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact 11340 

ggagcacctc aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat 11400 

tgtggtttca aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt 11460 

gaaaaagctg ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc 11520 

gtcttgttat aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat 11580 

aataaatggc taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct 11640 

gcgtaaaaga tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg 11700 

aaaacctata tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac 117 60 

gggaaaagga catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact 11820 

ttgaacggca tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct 11880 

cggaagagta tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca 11940 

tcaggctctt tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc 12000 

gcttagccga attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact 12060 

gggaagaaga cactccattt aaagatccgc gcgagctgta tgatttttta aagacrggaaa 12120 

agcccgaaga ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga 12180 

aagatggcaa agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt 12240 

atgacattgc cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg 12300 

agctattttt tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt 12360 

tactggatga attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag 12420 

cgcaccgact tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat 12480 

ttgggcaagg ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag 12540 
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gacggccaga cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc 12600 
aaggcaccag gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca 12660 
atcccgcaag gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg 12720 
atcgacgcgg ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt 12780 
gcgccccgcg aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc 12840 
gagcgcgaca gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag 12900 
cgttcgcgtc gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg 12960 
cgaggaacta tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc 13020 
agcgaggcca agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag 13080 
ctttccttgt tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg 13140 
gcccgctctg ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac 13200 
aaggtcattt tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg 13260 
gccgacgatg acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc 13320 
ggcgagccga tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat 13380 
ggccggtatt acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc 13440 
ttcacgtccg accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc 13500 
ctggaccgtg gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg 13560 
ctgtttgctg gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg 13620 
acggcccgac ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg 13680 
gaaaccttcc gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag 13740 
gtcggcgaag cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat 13800 
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gatgacctgg tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca 13860 

gcagccagcg ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc 13920 

gctcagtatc gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa 13980 

aattgacaat tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt 14040 

tccgcgagat ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg 14100 

agcacgagga gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat 14160 

tcggcgccta catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc 14220 

ccaaggacgc tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc 142 80 

gaggggtcgc cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg 14340 

tccgacagat tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata 14400 

tttcgctatt ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg 14460 

cgacggtagg cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta 14520 

gcccgatacg attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt 14580 

tggtgttgac accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg 14640 

cggtttccat ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc 14700 

tcacctttac cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag 14760 

tgtttgatcc gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg 14820 

gcctgatcgg agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac 14880 

ctacagttgt ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga 14940 

tgcatcaggc cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg 15000 

ataggggagt tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc 15060 



WO 2004/063358 PCT7EP2004/000100 

338/358 

agcggcttta tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt 15120 
cacggttaag cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga 15180 
tatttgatca caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga 15240 
gatcatccgt gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac 15300 
atgagcaaag tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg 15360 
ctgcctgtat cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct 15420 
ggtggcagga tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg 15480 
cggacgtttt taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg 15540 
attgcccttc accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc 15600 
cagcaggcga aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca 15660 
aaagaatagc ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta 15720 
aagaacgtgg actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta 15780 
cgtgaaccat cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg 15840 
aaccctaaag ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga 15900 
aaggaaggga agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg 15960 
gcgatcggtg cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag 16020 
gcgattaagt tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag 16080 
tgaattcgag ctcggtaccc ggg 16103 

<210> 63 

<211> 25 

<212> DNA 

<213> Artificial 
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<220> 

<223>. Primer 
<400> 63 

ggcgtacttg aaggaaccct taccg 



<210> 64 

<211> 25 

<212> DNA 

<213> Artificial 

<220> 

,<223> Primer 

<400> 64 

attgatgctc ccggtcaccg tgatt 



25 



25 



<210> 65 
<211> 500 
<212> DNA 

<213> Blakeslea trispora 
<400> 65 

aatctataca atgctccata gactcacatt gatattgtcg aagatttcga tgctgactta 60 
gtagagcaac tacaaaagtt agcagagaag catgatttct taatctttga agaccgcaag 120 
tttgcagata tcggtatgtg aattctatct attttttttc tgatgtgtgc atggatgact 180 
catgatcata ttcttaggta atactgtcaa gcatcaatat ggcaagggcg tttacaagat 240 
tgcttcttgg tctcatatta ctaatgctca cacagttcct ggagaaggta ttatcaaggg 300 
acttgccgaa gtcggcctcc ctcttggtcg tggcttgctt ttgctagcag aaatgtcatc 360 
tcaaggtgca ttaactaagg gtatttacac tgccgaatct gtcaatatgg ctcgccgcaa 420 
caaagatttc gtttttggct ttattgcaca acacaaaatg aatcagtatg atgatgagga 480 
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ttttgttgtc atgtcgcctg 500 



<210> 66 
<211> 611 
<212> DNA 

<213> Blakeslea trispora 
<400> 66 

gagattaaaa tagataagga aaagaaagtg aaaagaaatt cggaagcatg gcacattctt 60 

ctttttataa atacatgcct gactttcttt ttccatcgat atgatatatg catatgatag 120 

atatacaagc aatcttcttc aaggagtttg aaattttgtc ctccaggagc aaaaaaaagt 180 

ttttttttat acatgtttgt acacaagaat agttaccaat ttgctttggt cttacgtgct 240 

gcaagtttat atcgttttca atttctttgt ctttacattt tctttgtcct ttatctttcc 300 

tcatttagtc tttgggagaa ttaggaaaag ggagcggaaa ggtaagaaat gcttgcgtat 360 

tttactaatt cggcaaacat ccaatttggc aaacagcagc ctgtgcaacg ctctcgagat 420 

gacagtatct ttgattacac tctaaatctc gatgacccga ccaaaaagag cgaacaaaga 480 

aataatcttg tgcattcgaa tatgatggaa gattttttcc cccttattct aaatgjttgac 540 

atagcgtgta tgttatataa acaaaaagaa attgtacaaa ctttcttttc ttctcttttt 600 

attttatctc t 611 



<210> 67 
<211> 720 
<212> DNA 

<213> Biakeslea trispora 
<400> 67 

atgtcaatac tcacttatct ggaatttcat ctctactata cactacctgt ccttgcggca 60 
ttgtgttggc tgctaaagcc gtttcactca cagcaagaca atctcaagta taaattttta 120 
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atgttgatgg ccgcctctac cgcatcgatt tgggacaatt atatcgttta tcatcgcgct 180 

tggtggtact gtcctacttg tgttgtggct gtcattggct atgtacctct agaagaatac 240 

atgttcttta tcatcatgac .tttaatgact gtcgcgttct caaactttgt tatgcgttgg 300 

cacttgcata ctttctttat tagacccaac acttcttgga agcaaacact attagtacgc 360 

cttgtgcctg tttcagcttt attggcaatc acttatcatg cttggcactt gacactgcca 420 

aataaacctt cattttatgg ttcatgcatc ctttggtatg cttgtcctgt gttggctatt 480 

ctttggctgg gtgctggcga atatatcttg cgtcgacctg tggctgtcct tttgtctatt 540 

gttatcccta gtgtatacct atgttgggct gatatcgtcg ctattagtgc tggcacatgg 600 

catatttctc ttagaacaag cactggcaaa atggtagtac ccgatttacc tgtagaagaa 660 

tgcctgtttt ttactttgat caacacagtc ttggtttttg ctacctgtgc tatagaccgc 720 

<210> 68 
<211> 1089 
<212> DNA 

<213> Blakeslea trispora 
<400> 68 

ctgtacaaat catctgttca aaatcaaaac cctaaacaag ccatttccct tttccagcat 60 

gtcaaagagc tagcatgggc cttctgtctt cctgaccaaa tgctcaacaa tgaattgttt 120 

gatgatctta ctatcagctg ggatatttta cgtaaagcct caaagtcatt ctatactgca 180 

tctgccgttt ttccaagtta tgtacgtcaa gacttgggtg ttctctatgc tttctgcaga 240 

gctaccgatg acctgtgcga tgatgaatcc aaatctgttc aagaaagaag agaccaatta 300 

gatcttactc gacaatttgt tcgtgatctc tttagccaaa agaccagtgc gcctattgtg 3 60 

attgattggg aattgtatca aaaccaactt cctgcttctt gtatatcagc ctttagagcc 420 

tttactcgcc ttcgccatgt ccttgaagta gaccctgtag aagaactatt agatggttac 480 
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aaatgggatc ttgagcgtcg tcctatcctt gatgaacaag acttggaggc atactctgct 540 

tgtgtggcca gtagtgtggg tgaaatgtgc acacgtgtga ttcttgctca agaccaaaag 600 

gaaaatgatg cttggataat tgaccgtgca cgtgagatgg ggctggtgct acaatacgtt 660 

aacattgctc gagacattgt gactgatagc gagactctgg gtcgatgtta tctgcctcaa 720 

caatggctta gaaaagaaga aacagaacaa atacagcaag gcaacgcccg tagcctaggt 780 

gatcaaagac tgttgggctt gtctctgaag cttgtaggaa aggcagacgc tatcatggtg 840 

agagctaaga agggcattga caagttgccg gcaaactgtc aaggcggtgt acgagctgct 900 

tgccaagtat atgctgcaat tggatctgta ctcaagcagc agaagacaac atatcctaca 960 

agagctcatc taaaaggaag cgaacgtgcc aagattgctc tgttgagtgt atacaacctc 1020 

tatcaatctg aagacaagcc tgtggctctc cgtcaagcta gaaagattaa gagttttttt 1080 

gttgattag 1089 

<210> 69 
<211> 611 
<212> DNA 

<213> Blakeslea trispora 
<400> 69 

agagataaaa taaaaagaga agaaaagaaa gtttgtacaa tttctttttg tttatataac 60 

atacacgcta tgtcaacatt tagaataagg gggaaaaaat cttccatcat attcgaatgc 120 

acaagattat ttctttgttc gctctttttg gtcgggtcat cgagatttag agtgtaatca 180 

aagatactgt catctcgaga gcgttgcaca ggctgctgtt tgccaaattg gatgtttgcc 240 

gaattagtaa aatacgcaag catttcttac ctttccgctc ccttttccta attctcccaa 300 

agactaaatg aggaaagata aaggacaaag aaaatgtaaa gacaaagaaa ttgaaaacga 360 
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tataaacttg cagcacgtaa gaccaaagca aattggtaac tattcttgtg tacaaacatg 420 
tataaaaaaa aacttttttt tgctcctgga ggacaaaatt tcaaactcct tgaagaagat 480 
tgcttgtata tctatcatat gcatatatca tatcgatgga aaaagaaagt caggcatgta 540 
tttataaaaa gaagaatgtg ccatgcttcc gaatttcttt tcactttctt ttccttatct 600 



attttaatct c 



<210> 70 

<211> 882 

<212> DNA 

<213> Haematococcus pluvialis 



611 



<400> 70 

atgctgtcga agctgcagtc aatcagcgtc aaggcccgcc gcgttgaact agcccgcgac 60 

atcacgcggc ccaaagtctg cctgcatgct cagcggtgct cgttagttcg gctgcgagtg 120 

gcagcaccac agacagagga ggcgctggga accgtgcagg ctgccggcgc gggcgatgag 180 

cacagcgccg atgtagcact ccagcagctt gaccgggcta tcgcagagcg tcgtgcccgg 240 

cgcaaacggg agcagctgtc ataccaggct gccgccattg cagcatcaat tggcgtgtca 300 

ggcattgcca tcttcgccac ctacctgaga tttgccatgc acatgaccgt gggcggcgca 360 

gtgccatggg gtgaagtggc tggcactctc ctcttggtgg ttggtggcgc gctcggcatg 420 

gagatgtatg cccgctatgc acacaaagcc atctggcatg agtcgcctct gggctggctg 480 

ctgcacaaga gccaccacac acctcgcact ggaccctttg aagccaacga cttgtttgca 540 

atcatcaatg gactgcccgc catgctcctg tgtacctttg gcttctggct gcccaacgtc 600 

ctgggggcgg cctgctttgg agcggggctg ggcatcacgc tatacggcat ggcatatatg 660 

tttgtacacg atggcctggt gcacaggcgc tttcccaccg ggcccatcgc tggcctgccc 720 

tacatgaagc gcctgacagt ggcccaccag ctacaccaca gcggcaagta cggtggcgcg 780 



WO 2004/063358 PCT/EP2004/000100 

344/358 



ccctggggta tgttcttggg tccacaggag ctgcagcaca ttccaggtgc ggcggaggag 840 
gtggagcgac tggtcctgga actggactgg tccaagcggt ag 882 

<210> 71 
<211> 528 
<212> DNA 

<213> Erwinia uredovora 
<400> 71 

atgttgtgga tttggaatgc cctgatcgtt ttcgttaccg tgattggcat ggaagtgatt 60 
gctgcactgg cacacaaata catcatgcac ggctggggtt ggggatggca tctttcacat 120 
catgaaccgc gtaaaggtgc gtttgaagtt aacgatcttt atgccgtggt ttttgctgca 180 
ttatcgatcc tgctgattta tctgggcagt acaggaatgt ggccgctcca gtggattggc 240 
gcaggtatga cggcgtatgg attactctat tttatggtgc acgacgggct ggtgcatcaa 300 
cgttggccat tccgctatat tccacgcaag ggctacctca aacggttgta tatggcgcac 360 
cgtatgcatc acgccgtcag gggcaaagaa ggttgtgttt cttttggctt cctatatgcg 420 
ccgcccctgt caaaacttca ggcgacgctc cgggaaagac atggcgctag agcgggcgct 480 
gccagagatg cgcagggcgg ggaggatgag cccgcatccg ggaagtaa 528 

<210> 72 
<211> 762 
<212> DNA 

<213> Nostoc sp. PCC73102 
<400> 72 

atgatccagt tagaacaacc actcagtcat caagcaaaac tgactccagt actgagaagt 60 
aaatctcagt ttaaggggct tttcattgct attgtcattg ttagcgcafcg ggtcattagc 120 
ctgagtttat tactttccct tgacatctca aagctaaaat tttggatgtt attgcctgtt 180 
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atactatggc aaacattttt atatacggga ttatttatta catctcatga tgccatgcat 240 

ggcgtagtat ttccccaaaa caccaagatt aatcatttga ttggaacatt gaccctatcc 300 

ctttatggtc ttttaccata tcaaaaacta ttgaaaaaac attggttaca ccaccacaat 360 

ccagcaagct caatagaccc ggattttcac aatggtaaac accaaagttt ctttgcttgg 420 

tattttcatt ttatgaaagg ttactggagt tgggggcaaa taattgcgtt gactattatt 480 

tataactttg ctaaatacat actccatatc ccaagtgata atctaactta cttttgggtg 540 

ctaccctcgc ttttaagttc attacaatta ttctattttg gtactttttt accccatagt 600 

gaaccaatag ggggttatgt tcagcctcat tgtgcccaaa caattagccg tcctatttgg 660 

tggtcattta tcacgtgcta tcattttggc taccacgagg aacatcacga atatcctcat 720 

atttcttggt ggcagttacc agaaatttac aaagcaaaat ga 762 

<210> 73 
<211> 617 
<212> DNA 

<213> Haematococcus pluvialis 
<400> 73 

tagggtgcgg aaccaggcac gctggtttca cacctcatgc ctgtgataag gtgtggctag 60 

agcgatgcgt gtgagacggg tatgtcacgg tcgactggtc tgatggccaa tggcatcggc 120 

catgtctggt catcacgggc tggttgcctg ggtgaaggtg atgcacatca tcatgtgcgg 180 

ttggaggggc tggcacagtg tgggctgaac tggagcagtt gtccaggctg gcgttgaatc 240 

agtgagggtt tgtgattggc ggttgtgaag caatgactcc gcccatattc tatttgtggg 300 

agctgagatg atggcatgct tgggatgtgc atggatcatg gtagtgcagc aaactatatt 360 

cacctagggc tgttggtagg atcaggtgag gccttgcaca ttgcatgatg tactcgtcat 420 



I 
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ggtgtgttgg tgagaggatg gatgtggatg gatgtgtatt ctcagacgta gaccttgact 480 

ggaggcttga tcgagagagt gggccgtatt ctttgagagg ggaggctcgt gccagaaatg 540 

gtgagtggat gactgtgacg ctgtacattg caggcaggtg agatgcactg tctcgattgt 600 

aaaatacatt cagatgc 63- 7 

<210> 74 
<211> 1208 
<212> DNA 

<213> Haematococcus pluvialis 
<400> 74 

attgtgactg atagcgagac tctgggtcga tgttatctgc ctcaacaatg gcttagaaaa 60 

gaagaaacag aacaaataca gcaaggcaac gcccgtagcc taggtgatca aagactgttg 120 

ggcttgtctc tgaagcttgt aggaaaggca gacgctatca tggtgagagc taagaagggc 180 

attgacaagt tgccggcaaa ctgtcaaggc ggtgtacgag ctgcttgcca agtatatgct 240 

gcaattggat ctgtactcaa gcagcagaag acaacatatc ctacaagagc tcatctaaaa 300 

ggaagcgaac gtgccaagat tgctctgttg agtgtataca acctctatca atctgaagac 360 

aagcctgtgg ctctccgtca agctagaaag. attaagagtt tttttgttga ttagtgaatt 420 

tttgttttat ttatgtctga tagttcaata aagagacaac acatacaata taaaatcatt 480 

gtctttaaat gttaatttag tagagtgtaa agcctgcatt ttttttgtac gcataaacaa 540 

tgaattcacc ccgcttctgg tttttaaata attatgtcaa actagggaaa attctttttt 600 

ttctcttcgt tctttttttg gcttgttgtg gagtcacagg cttgtcttca gattgataga 660 

ggttgtatac actcaacaga gcaatcttgg cacgttcgct tccttttaga tgagctcttg 720 

taggatatgt tgtcttctgc tgcttgagta cagatccaat tgcagcatat acttggcaag 7 80 
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cagctcgtac accgccttga cagtttgccg gcaacttgtc aatgcccttc ttagctctca 



840 



ccatgatagc gtctgccttt cctacaagct tcagagacaa gcccaacagt ctttgatcac 



900 



ctaggctacg ggcgttgcct tgctgtattt gttctgtttc ttcttttcta agccattgtt • 960 

gaggcagata acatcgaccc aacatcctcg agccatacta cagcataaaa ggatacgttt 1020 

tctttaacag aaatttaccc ttttgttatc agcacataca aaaaaaaaga aatttaagat 1080 

gagtaggact tccattctct caaaaatttt attcaatcca taaatgaatt atttttggac 1140 

aaaaaagaaa gattatgcct gattttctct attttttttt tttttacaac tccaccaata 1200 

ctttctag 1208 

<210> 75 

<211> 6316 

<212> DNA 

<213> Blakeslea trispora 
<220> 

<221> misc_f eature 

<222> (2694) . . (2694) 

<223> n is a, c, g, or t 

<220> 

<221> misc__f eature 

<222> (4263) . . (4263) 

<223> n is a, c, g, or t 



<400> 



75 



aaggatgaag aatccaactc taataaaaat cttatggata tctttgatcg actcaaaaag 



60 



gctttcaatg ctattgctat taaaaaaaaa gagagagaga gaactatgag caaaaggact 



120 



ctatgccaag atggcaaaaa ggcaccagaa acccttagtt tattattgca taatccagtc 



180 



gagctagtac ttctgtagct caagcttaac cgaggatctt ggaatcaact cgtctcgtca 240 
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ctcttgccga tgatcctaga aatggtatct atggatgtta tactaacatt gttatctttc 300 

aaggcctcga agatgttatt gttgcggtga taaataggct gctatgtach gaagttgctc 360 
tgtaaaatga atctagttca ctgcctactc agcaaatggt tgtttctaat gtctttaaag 420 
aaagaaaaaa agatacatat agactaccct tcctttcaag actgtaatcg agaatcggcc 480 
gatggtttat tacaattaga cgctgggaat aagcaaaagg attcatcttt gtaaataaga 540 
gactggtgca tatgaaagca aggatcgtat caaggaatag ttttgatcga gcatcaccag 600 
caaatgctgc taatgttggc ttcttctttg cttcctgaga ttgaatggga tgtgcctaga 660 
gcattgctat ttttaagtgt atactttaga tttgtgtctt tagatttgtg tcattttatt 720 
tagtcaagaa agatccccct ttctctatgt atgctaagaa gaaggagcaa gaagtgtatt 780 
tacaagttgg aatgagattg aaatattgta cataataata ataaaaagaa aggtagatca 840 
aaaaaaatgt tctgcctatt gtaagaaatc gggaccaaca ggtgcttgat aaccagaagt 900 
agcttccaat tcaggtagag gctctaggga caaatacaca attatgacag gaattttctt 960 

gttgacttga acactacaag agaaacgggt cagcacaaaa tccgaaaaaa aaaagaaacg 1020 

gaccattcat gtcttaccta tctagctctt tgtcttcaat tgcatcccat tgctcaacca 1080 

cagatacgct tcccaattga gtatattgat gaagtgttcc ctgcattttt cgcttgacta 1140 

attccactac agtcacagtc ttattaatgt tttgtccttt accagtcagg ataatatgat 1200 

ctttttgctt cttctatcaa aaaaataatt cttgttttga ataaaaaaaa caaatattta 1260 

aagaaactac tttgatgacg gtacctggaa taactcgaga cacacatcta catatgcgtt 1320 

gattttattg tggctaattc gaacctcatt ttctgctggt gggggctgtt gactttcagt 1380 

tgctgagacg tccttcttgc ttcttttata gtcttccact atgattttaa tcaagaaagt 1440 

aagtcagtga tgattgttac aagctatata tcttgaaaaa gaacagagag gtattattat 1500 
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cagatgcaac atggttttct gtatcatttt catttcagtt tctctgttca aaaaaaaaaa 1560 

gaacactttc tctttccact cctcaaattt tttctgctaa actcctcgca aaacatgtat 1620 

ttgctttaaa ctacaagttg caattgtctg atttagcaat ttcaatatgc cttttgtgaa 1680 

tccacccaaa aataaacaag tgcttgagta tacttgggtt cagttcaaaa gaaagcaagc 1740 

tttttttttt ctttcttggg aaagaaaaaa aaatattgtt gagccatcct ttaccagcag 1800 

tatgcgagct acgacatagc tggtctaaca atgactgcaa gcaatagatc gagcttagtc 1860 

tttctattgc ttcyttgttt gatctatgtt cggccttacg ctgacctatc caatactcga 1920 

gataggcaac aagatttcga acagtaatga aataaatttc ggataacagt tgtggatgag 1980 

gaagagaaag cgacttgaac tcgagaaact ttgttgaaat gaaatccgac cttttacgtg 2040 

atcatcatgt attatcctct ttttcttttt tttcgtagtg aattacttac tgattgcgct 2100 

caagtcgcgt ctttataaag aagaaaaaaa aatattagaa ctttcaaaaa atataactga 2160 

aaataaaagt gtggctcgga gagcaaatac cacatccttt gtcttcgctt tggtaacacg 2220 

gttaataagc cactataggt gaataatgat catttctgag aataaagcgc ggcttgaagc 2280 

ttatatccat atcaggattc atattaggca caactcacaa ttgaggttcc agaagtgcca 2340 

attttttttt cctgatagcc tgtccaatta agatcaaaaa ccactgagtt ttctctatat 2400 

attttttttt ttcataattc ttaactcttc ttcctctctc tctctctctc tctctttttg 2460 

gcttgcaaaa aaaatcttta gtaataccaa agaaagcaaa ccttttcctt ttcttatttc 2520 

cttgcttgtt ttttaatttt tgatttctct atgctttaaa tacccatttc tttctttctt 2580 

ctgctattac ctatcttttc attcctctcc cccctctctc tcttggtcta taaacatcat 2640 

gaagtcctct tttaaaagtt cgcttgacat ttatgctgtt tatatacagc atcntgtgtt 2700 

ttccaagtgg ttcattcttg cttttgttct ttcgattttc ctcaacactt atctactgaa 2760 
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cgcttcgaag caacagccca aagtgataat caaaaaggtt attgagcggg tagaagtacc 2820 

aagtagagaa caacctaaat cagtcataaa gccctcctcc aagaaacact cttctcatca 2880 

tcagtctgat gtcattcgcc ctcttgatga agtattgggt ttgctcggaa cacccgaggc 2940 

cttgactgat gaagagatca tctctattgt tcaagctggt aaaatggccc cctatgctct 3000 

tgaaaaggtc ttgggcgatt tagagcgcgc tgtccatatc cgtcgtgctt tgatctcccg 3060 

tgactctcgt acgaaaactt tggaagacag tatgcttccc gtgaaaaact atcattatga 3120 

taaagtcatg ggtgcttgtt gtgaaaatgt cattggttat atgcctattc cagtaggtgt 3180 

cgcaggtaag aagttcaaca agtcgcgata tttgacaagt tgctcatcat tttcgaaaca 3240 

ggtcctttgg tgattgatgg tgattctatt catattccca tggcaactac ggaaggttgt 3300 

ttagttgctt ctactgccag aggttgtaaa gcaatcaatg ctggtggtgg tgccaacaca 3360 

attgttgttg ctgatggtat gactcgaggt ccttgtgtcg aatttcctac aatcactcgc 3420 

gctgctgact gtaaacgatg gattgaacaa gagggtgaag ctatcgtgac cgaggcattc 3480 

aattcaactt ctcgttttgc tcgtgttcgt aaattgaaag ttgctcttgc cggtcgtcta 3540 

gtctacatcc gtttctctac cactacaggt gatgcaatgg gcatgaacat gatctccaag 3600 

ggttgtgaaa aggctttaag caagattgct gagagatatc ctgatatgca gatcatttct 3660 

ctttctggta actattgtac tgacaagaaa cctgctgcta tcaactggat tgaaggacgt 3720 

ggtaaatctg ttgttgctga sgctgtcatc cctggtacgg ttgtcgaaaa ggtattgaag 3780 

acctctgtta gtgctttggt tgagctgaac atctctaaaa acctggttgg ttctgctatg 3840 

gctggctccg tcggtggctt taacgctcat gctgctaata ttctaactgc catttacctt 3900 

gctactggtc aagatcctgc tcaaaatgta sagagttcta actgtattac tttgatgaaa 3960 

gctgtcaatg gcgaaagaga ccttcatatc tcttgtacaa tgccctgtat tgaagtaggc 4020 
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accattggtg gtggtactat tttgcctcct caacaagcca tgttggattt cattggtgtg 4080 

cgtggtcctc accctaccga acctggtgcc aatgcccgwc gccttgctcg tgttatctgt 4140 

gcctctgtga tggctggtga attgtcttta tgtgcagctt tggctgctgg tcatcttgta 4200 

aaggcacaca tggctcataa tcgtaatacc actgctgctg ccgctgttgt tcctgcccct 4260 

aanggcatag ttgatgtctc tacacctcct gctacacctg cagaaaagaa tgatcctatt 4320 

cctggaagtt gtatcaagtc atagaattaa tattatatat atatcatata caaaaaaaag 4380 

aaaaaaaaaa cactacatct atttatattt ctccatgtac acacacacac acacatataa 4440 

aaactcttta ttttccaata ttttgctttt ataaataatc ttatttcatt ctaaataaac 4500 

tgtttttttt tattaatcat caaaccctgc tgagagctgt gcaatatcat ctatgttttc 4560 

atggtttaac tctggtatcg gwcgagcctc ctctgtactt gaagtttgta ggcagttttt 4620 

atttaaggct gctggtcgat catgatcatc akcaaacctg acagcatgaa gttttgactg 4680 

atgagcaatt tcactaaggg cagaatctga actctttcgc ttcctactat tgaccatatt 4740 

gtctttaggt ggaatgagtg aatagcgtct tgtcatatgt aacacagaat caacaatatc 4800 

ctggtgatga aactcggcca aacatagcgc ctttctcccc caacaattat aataatcaaa 4860 

atgagaatga catgtacggt tttcctcgat gacaatatcc aacgtcttgt cataatcctc 4920 

tgtgcgyata ccattcatct tttggaagaa cgcacggtag ctctcacaag ctgtcctcag 4980 

agagttccgt gccatgtttc ccaatgctcc tggcaagtcg aaatgaagtt gtcgaatctg 5040 

gcgatgtatg tctacaatgt cgcctgtttc tttcattaga tcaagcattc gtgtagccca 5100 

aatgatgtct atgttatgat tttctttcat tccagtaata actatagttt ctcggcaaat 5160 

cgaatgastg atggagtaaa ttcatcaaaa gtgcaagtaa tacatacagt gcttgaagaa 5220 

atcttgtgta gcacgcctat attatgtaat ataggatcga ttctcgaaac tcgacataac 5280 
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caccaggctt tagcaagcgt tttatttcat tcatgacaag ctattgttaa ttcytgctta 5340 

ataaaacaaa atgaaaaaaa catacccccc tcmaaactta cttcccactc ttgattggaa 5400 

aaacaggtat agacgtgacg catatgtata taatcaaaac actcatcagg atagggtaaa 5460 

ccattgagca catcgcattg ggtgaagaaa gtattaggag gcttgatggc tgtaggatat 5520 

ataggtgcaa tatcaatacc gtaaaactca gcatttggga attctgtagc catctccaga 5580 

atccaagtac ctgtgccaca agcaacatca agcactttag gtaagggtat acattgttgt 5640 

tcttgttgtt gttgttgaca atcacttgag tctgagtttc gttttgattg ttttaatgac 5700 

aataattctt ttacaggtgc tgagaaatta ccgtcaaata gatacttgta aataaaatgc 5760 

taaaaataaa aacaatagaa aaaaaaattg acgctcattt cattactatg gaaataactg 5820 

caaaatctta ccacttgtac aagtctatct tgctcaatct catcgtttgg cagaatgtat 5880 

ttattgttgt agtattgata tcttctacca ttcatgatat aactgtcgct tctaatgctc 5940 

tgaggtgaag tacttgtagg tgaaggtgga agtgacgcaa ttttgtcaag cttaacagga 6000 

tcctctcggc tacatgtttt ctgcatatca ggaaaatctt gtttatttga aacatcaaca 6060 

gtagatgtgg tgtgatcttt tttgaaaata tcgatgcctt cctttgaaag ccttttgaaa 6120 

ggctctttta acttttttga gtgagagcta cccatgatag cttatgaaga attaaaaaga 6180 

aaaaagcaaa aaaaattaaa aaaaaaaaaa gtagcaaaaa attctgtcgt aattatacaa 6240 

gccaatcaaa atcgaaattc atgcaaggca tagatgttca cgtggatttg atggttgatc 63 00 

cttttttttt gcaaga 6316 

<210> 76 
<211> 1170 
<212> DNA 
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<213> Thermus thermophilus 
<400> 76 

atgaagcgcc tttccctgag ggaggcctgg ccctacctga aagacctcca gcaagatccc 60 

ctcgccgtcc tgctggcgtg gggccgggcc cacccccggc tcttccttcc cctgccccgc 120 

ttccccctgg ccctgatctt tgaccccgag ggggtggagg gggcgctcct cgccgagggg 180 

accaccaagg ccaccttcca gtaccgggcc ctctcccgcc tcacggggag gggcctcctc 240 

accgactggg gggaaagctg gaaggaggcg cgcaaggccc tcaaagaccc cttcctgccg 300 

aagaacgtcc gcggctaccg ggaggccatg gaggaggagg cccgggcctt cttcggggag 360 

tggcgggggg aggagcggga cctggaccac gagatgctcg ccctctccct gcgcctcctc 420 

gggcgggccc tcttcgggaa gcccctctcc ccaagcctcg cggagcacgc ccttaaggcc 480 

ctggaccgga tcatggccca gaccaggagc cccctggccc tcctggacct ggccgccgaa 540 

gcccgcttcc ggaaggaccg gggggccctc taccgcgagg cggaagccct catcgtccac 600 

ccgcccctct cccaccttcc ccgagagcgc gccctgagcg aggccgtgac cctcctggtg 660 

gcgggccacg agacggtggc gagcgccctc acctggtcct ttctcctcct ctcccaccgc 720 

ccggactggc agaagcgggt ggccgagagc gaggaggcgg ccctcgccgc cttccaggag 780 

gccctgaggc tctacccccc cgcctggatc ctcacccgga ggctggaaag gcccctcctc 840 

ctgggagagg accggctccc cccgggcacc accctggtcc tctcccccta cgtgacccag 900 

aggctccact tccccgatgg ggaggccttc cggcccgagc gcttcctgga ggaaaggggg 960 

accccttcgg ggcgctactt cccctttggc ctggggcaga ggctctgcct ggggcgggac 1020 

ttcgccctcc tcgagggccc catcgtcctc agggccttct tccgccgctt ccgcctagac 1080 

cccctcccct tcccccgggt cctcgcccag gtcaccctga ggcccgaagg cgggcttccc 1140 

gcgcggccta gggaggaggt gcgggcgtga 1170 
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<210> 77 
<211> 2981 
<212> DNA 

<213> Blakeslea trispora 
<400> 77 

tctagaattc attccattcg aaaggatcaa cataaccaat ttaatgacta ctagctaatg 60 

gatacaaata tacgcacaaa aaaagaaaga attctatgat caaagagaac acagacacag 1?0 

agtgatacat ttaaatggtt aagttcttat gatgttaaaa tggtaacttt attattgaat 180 

taaatgcgaa tatcgttgct gctttgtact tggaaaacgt taggtaaaag ttggttaatg 240 

aaagaagcag gagttgtagt atcatctctt gggaagaaat agaaaaagag gaaagtaaca 300 

aagtaacaag caagacaata atagatccaa tggctttcgg tcttacgagt ttgttcagga 360 

gcatacttct tttggctatc ttgtaacttt cttggtaagg gattctggcc aaagctttta 420 

cagacttggt cggaagtaag cttacttcca gcaagaacga taggaacacc agtacctgga 480 

tgtgtactac aaagaaaaga gaaatgagta cgtgcgttat taaaaaaaag aaaaaaagag 540 

ggcaaaagta ttacctagct ccgacaaaga aaagattatc ataacggttt gtggaatcct 600 

tggtactagg tctgaaccag agaacttgga acacatcatg agaaagacca agaatagaac 660 

ctctccaaag gttaaacttg ctttgccaaa cactaggatc attcacttct tcatgttcaa 720 

tcaaattagc aaagttgttt actcccaaac gacgttcgat aacttccaga accatcttgc 780 

gtgcacggtt taccaactca ggataatttt cttcagcact gtttcctgtc ttactcttca 840 

tatggccaat tggaaccaac acaataatgg agtccttgtt gggaggtgcg gcagattcat 900 

caattcgaga tggaacgttg acatagaatg aagcttcaga gggcaaaccg aagtcgttga 960 

aaatctcatc aaaactttcc ttgtaggctt cagccaagaa gatattgtgt acgtctaatt 1020 
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gaggcacctt tgttgacatg gaccaataaa acgaaataga tgatgaagtg agtttctttg 1080 

aggctaatgt cttctttgtc caattgcaag gaggtaacag atggtgataa gcataaacaa 1140 

gatccgcatt acatacgact gcatcggctt caatgacttc tccgctttcc aaagtgacac 1200 

cggttacacg cttgtcttta tcgacagtgt taattttagc aacaggcgat tgatatctga 1260 

attcagcacc gtactttttg gaggcgatag actcaagctt ctgaacaacc atgttgaaac 1320 

caccacgagg ataccagata ccttcagcaa actcggtgta ttgtaacaaa ctgtaaactg 1380 

ctggagcatc ataaggcgac atactatatt ccaaaaatag aaaatagaac aatgaatatc 1440 

aaaattcctt tcacttgccc tttttcacat ttctcttttc ccacccccga ccggtctcac 1500 

tcattttttt ttcatcccac accacgcgtt gtatgtgtac ttaccccata tacattgttt 1560 

gaaaagtaaa agccatacgc attttcttgg tttggaaata tttactggct cggtcataga 1620 

tcttaccaaa caagtgcaag cgaaagattt caggcacata ctgaagacga atcaaatccc 1680 

aaatggtttc aaagttgcgc ttgatagcaa taaatgtacc ttgttcataa tggacatgtg 1740 

tttccttcat gaaatccaag aatctaccaa atccaagggg accctcaata cggtccaatt 1800 

cgcccttcat cttggttaaa tcggaagaga gttgtacggc atcaccgfccg tcaaaatgaa 1860 

ccttatagtt attgtcacag cgaagcaaat ccaaatgatc accaatacgt tcatccaaat 1920 

cagcaaatgc atcttcaaaa agcttaggca tcaaatagag tgagggaccc tgatcaaagc 1980 

gatgaccatc gtgatgaatg aatgaacaac ggccaccgga aaagtcgttc ttttcaacaa 2040 

cagtaactcg aaaaccttca cgagcaagac gagcagcagt agcagttccg ccaataccgg 2100 

caccaatgac aacaatatgc ttcttttgat cagacatgag attaaaatag ataaggaaaa 2160 

gaaagtgaaa agaaattcgg aagcatggca cattcttctt tttataaata catgcctgac 2220 

tttctttttc catcgatatg atatatgcat atgatagata tacaagcaat cttcttcaag 2280 
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gagtttgaaa ttttgtcctc caggagcaaa aaaaagtttt tttttataca tgtttgtaca 2340 

caagaatagt taccaatttg ctttggtctt acgtgctgca agtttatatc gttttcaatt 2400 

tctttgtctt tacattttct ttgtccttta tctttcctca tttagtcttt gggagaatta 2460 

ggaaaaggga gcggaaaggt aagaaatgct tgcgtatttt actaattcgg caaacatcca 2520 

atttggcaaa cagcagcctg tgcaacgctc tcgagatgac agtatctttg attacactct 2580 

aaatctcgat gacccgacca aaaagagcga acaaagaaat aatcttgtgc attcgaatat 2640 

gatggaagat tttttccccc ttattctaaa tgttgacata gcgtgtatgt tatataaaca 2700 

aaaagaaatt gtacaaactt tcttttcttc tctttttatt ttatctctat gtcaatactc 2760 

acttatctgg aatttcatct ctactataca ctacctgtcc ttgcggcatt gtgttggctg 2 820 

ctaaagccgt ttcactcaca gcaagacaat ctcaagtata aatttttaat gttgatggcc 2880 

gcctctaccg catcgatttg ggacaattat atcgtttatc atcgcgcttg gtggtactgt 2940 

cctacttgtg ttgtggctgt cattggctat gtacctctag a 2981 

<210> 78 
<211> 1749 
<212> DNA 

<213> Blakeslea trispora 
<400> 78 

atgtctgatc aaaagaagca tattgttgtc attggtgccg gtattggcgg aactgctact 60 

gctgctcgtc ttgctcgtga aggttttcga gttactgttg ttgaaaagaa cgacttttcc 120 

ggtggccgtt gttcattcat tcatcacgat ggtcatcgct ttgatcaggg tccctcactc 180 

tatttgatgc ctaagctttt tgaagatgca tttgctgatt tggatgaacg tattggtgat 240 

catttggatt tgcttcgctg tgacaataac tataaggttc attttgabga cggtgatgcc 300 
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gtacaactct cttccgattt aaccaagatg aagggcgaat tggaccgtat tgagggtccc 360 

cttggatttg gtagattctt ggatttcatg aaggaaacac atgtccatta tgaacaaggt 420 

acatttattg ctatcaagcg caactttgaa accatttggg atttgattcg tcttcagtat 480 

gtgcctgaaa tctttcgctt gcacttgttt ggtaagatct atgaccgagc cagtaaatat 540 

ttccaaacca agaaaatgcg tatggctttt acttttcaaa caatgtatat gggtatgtcg 600 

ccttatgatg ctccagcagt ttacagtttg ttacaataca ccgagtttgc tgaaggtatc 660 

tggtatcctc gtggtggttt caacatggtt gttcagaagc ttgagtctat cgcctccaaa 720 

aagtacggtg ctgaattcag atatcaatcg cctgttgcta aaattaacac tgtcgataaa 780 

gacaagcgtg taaccggtgt cactttggaa agcggagaag tcattgaagc cgatgcagtc 840 

gtatgtaatg cggatcttgt ttatgcttat caccatctgt tacctccttg caattggaca 900 
aagaagacat tagcctcaaa gaaactcact tcatcatcta tttcgtttta ttggtccatg 960 

tcaacaaagg tgcctcaatt agacgtacac aatatcttct tggctgaagc ctacaaggaa 1020 

agttttgatg agattttcaa cgacttcggt ttgccctctg aagcttcatt ctatgtcaac 1080 

gttccatctc gaattgatga atctgccgca cctcccaaca aggactccat tattgtgttg 1140 

gttccaattg gccatatgaa gagtaagaca ggaaacagtg ctgaagaaaa ttatcctgag 1200 

ttggtaaacc gtgcacgcaa gatggttctg gaagttatcg aacgtcgttt gggagtaaac 1260 

aactttgcta atttgattga acatgaagaa gtgaatgatc ctagtgtttg gcaaagcaag 1320 

tttaaccttt ggagaggttc tattcttggt ctttctcatg atgtgttcca agttctctgg 1380 

ttcagaccta gtaccaagga ttccacaaac cgttatgata atcttttctt tgtcggagct 1440 

agtacacatc caggtactgg tgttcctatc gttcttgctg gaagtaagct tacttccgac 1500 
caagtctgta aaagctttgg ccagaatccc ttaccaagaa agttacaaga tagccaaaag 1560 
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aagtatgctc ctgaacaaac tcgtaagacc gaaagccatt ggatctatta ttgtcttgct 1620 
tgttactttg ttactttcct ctttttctat ttcttcccaa gagatgatac tacaactcct 1680 
gcttctttca ttaaccaact tttacctaac gttttccaag tacaaagcag caacgatatt 1740 
cgcatttaa 1749 



<210> 79 

<211> 25 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 

<400> 79 

ccgatggcga cgacggaagg ttgtt 25 



<210> 80 

<211> 25 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 



<400> 80 

catgttcatg cccattgcat cacct 



25 
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